向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
深度|这份“成绩单”,2023年会更好吗?******
文/国是君
1月17日,国家统计局公布2022年中国经济年报。统计显示,2022年中国GDP(国内生产总值)同比增长3.0%,经济总量突破120万亿元人民币。
这是一份来之不易的成绩单。国家统计局局长康义当天表示,2022年,面对风高浪急的国际环境和艰巨繁重的国内改革发展稳定任务,中国国民经济顶住压力持续发展。分季度看,一季度国内生产总值同比增长4.8%,二季度增长0.4%,三季度增长3.9%,四季度增长2.9%。从环比看,四季度国内生产总值与三季度持平。
中新社当天举行“国是论坛:2023年中国经济形势分析会”,邀请多位专家学者,深入解读2022年中国经济的运行特点,展望2023年经济走向。
白明:外贸增速二三季度有望回升
中国商务部经贸政策咨询委员会外贸专家 白明 中新社记者 田雨昊 摄
据官方数据,2022年中国进出口总值同比增长7.7%,规模首次超过40万亿元。分季度看,去年一、二季度中国进出口总值分别超过9万亿元和10万亿元,三季度进出口总值增长至11.3万亿元,为季度规模的新高点。四季度进出口总值继续保持11万亿元的水平。
中国商务部经贸政策咨询委员会外贸专家白明对中新社国是直通车表示,从轨迹运行上看,2022年中国外贸走势是“M”形:年初增速较高,3、4月份下滑,5、6、7月份反弹,此后逐级下探。这种情况以往并不是特别多见。
他表示,纵向比较看,大多数年份中国外贸不同月度增速不会有太大差距,外贸时而增长时而回落的“M”形走势还不是特别多见,这表明中国外贸面临的压力和挑战错综复杂。
在白明看来,去年中国外贸整体虽然保持增长,但仍存在一些问题和隐忧,如去年12月中国外贸增速只有0.6%,且按美元计12月进口、出口额同比均下降等。此外,如果做横向对比,2022年中国外贸增速虽优于其他主要经济体,却低于在劳动密集型产业上与中国存在一定替代关系的越南,这折射出中国外贸面临的国际市场竞争日益激烈。
他并表示,2022年中国与《区域全面经济伙伴关系协定》(RCEP)其他成员国贸易额同比增长7.5%,低于同期中国外贸整体增速。当然这背后有RCEP还没有对全体东盟国家生效的原因,但这也说明RCEP生效是一个“慢功夫”,需要通过产业结构调整带动贸易转移。
谈及2023年中国外贸前景,白明认为,疫情防控政策调整后外贸反弹需要一个过程,预计外贸回升可能在二季度、三季度。今后应着力夯实外贸产业基础,并对欧美经济复苏态势保持密切关注。
赵锡军:金融支持稳住经济大盘
中国人民大学中国资本市场研究院联席院长 赵锡军 中新社记者 田雨昊 摄
中国人民大学中国资本市场研究院联席院长赵锡军对中新社国是直通车表示,金融对支持稳住经济大盘发挥了重要作用。去年的流动性、社融和贷款等数据都证明了这一点。
央行公布的数据显示,2022年两次降准为实体经济提供超1万亿元长期流动性,运用再贷款再贴现、中期借贷便利、公开市场操作等多种方式投放流动性,为稳定宏观经济大盘提供了适宜的流动性环境。广义货币供应量M2同比增长11.8%,比上年末高2.8个百分点;人民币贷款增加21.31万亿元,比上年多增1.36万亿元;社会融资规模存量同比增长9.6%,社会融资规模增量为32.01万亿元,比上年多增6689亿元。
赵锡军表示,因为通胀压力不大,2022年全年货币供应增速较快,但企业融资需求并不充足。2022年各项经济指标波动性较大。社融总体增速6月份开始回落,此后回落幅度较大。宏观和微观在金融领域表现出较大分化,各种各样政策性支持措施出台后,在微观层面落地、被市场主体吸收消化时存在阻碍和困难。社融和信贷在不同月份表现出较大波动性,其中1月份、3月份、6月份和9月份,每个季度的第一个月投放量较大。
与此同时,赵锡军强调,官方的支持力度在加大,无论中长期信贷、基础设施信贷,还是科技企业、中小企业信贷、普惠和绿色贷款,支持力度都明显加大。央行结构性的工具越来越多,针对性越来越强。融资成本在去年一年持续下降,这和西方国家截然相反。去年,无论美联储还是欧洲央行都启动加息。
展望2023年,赵锡军预计,包括消费零售在内的各项指标将总体走向平稳,波动性会比2022年降低很多。2023年扩大内需的切入点是改善社会心理预期和提振发展信心。2023年,地方政府要重点考虑债务的可持续性及风险可控,中央不会对地方债务兜底。货币政策要精准有力,流动性要跟去年一样合理充裕。
王军:当下需要改革、牛市和企业家
华泰资产首席经济学家、中国首席经济学家论坛理事 王军 中新社记者 田雨昊 摄
华泰资产首席经济学家、中国首席经济学家论坛理事王军对中新社国是直通车表示,疫情给中国经济带来的短期影响需要时间进一步修复,只要继续稳住经济基本盘,未来中国经济前景依旧可期。
谈及今年中国经济形势,他认为,核心在于增信心和稳预期,可通过三方面工作扭转预期并改善三重压力问题。
一是当下迫切需要改革。2023年改革的核心是继续调整好政府和市场的关系,把部分领域要素价格扭曲的局面彻底地扭转过来,把市场在资源配置中起决定性作用以及更好发挥政府作用落在实处。
二是需要牛市。资本市场对于当下中国经济意义已不再局限于简单融资市场或者投资市场,而是资源配置的市场,也是激励科技创新和产业转型的市场,同时也是短期稳预期、稳投资、稳消费的市场,需要发挥资本市场财富效应的作用,把市场搞活。
三是需要企业家。这些企业家要勇挑重任,勇于创业创新,勇于拼搏奋斗、开拓市场,为改善社会心理预期、提振发展带来更多信心。对此,政府也应在政策、制度、法律、舆论等层面给予企业家更多支持和鼓励。
王军还表示,目前,中国需要尽快将经济增长恢复到潜在增速水平,以提振企业和消费者信心。若未来中国能继续稳住经济基本盘,整个社会欣欣向荣,大家同声共气往前闯、干事业,相信经过“休养生息”后的中国经济前景将更加可期。
宗良:从三方面科学看待2022年中国经济增速
中国银行首席研究员 宗良 中新社记者 田雨昊 摄
中国银行首席研究员宗良对中新社国是直通车表示,应从三方面来科学地看待2022年中国经济增长速度。
第一,这是多重压力背景下实现的较好增长。如果从全球经济比重来看,2019年中国经济占全球比重是16.33%,2020年是17.4%,2021年17.7%,2022年保持了基本相当的比重。“从这些方面看,这三年中国经济是不错的,取得这个增长速度很不容易。”
第二,三大需求呈现“东边不亮西边亮”。这体现出中国经济发展的韧性,也是下一步发展的基础。
第三,中国有望成为引领全球经济增长的重要经济体。宗良称,按照IMF预计,2023年中国经济是极少数增速超过2022年的经济体。而据上述分析,中国消费大幅度回升应是大概率事件,消费不仅将为中国经济增长提供动力,同时也为全球有关厂商提供有利发展条件。
宗良还提到,中国调整疫情防控政策,实现高水平对外开放,这种开放会给相关外商外资带来较好的发展条件,让民营企业、国有企业、外资企业等各种所有制企业达到公平竞争,提供良好营商环境。
宗良认为,中国较为妥善地解决了经济增长与疫情防控的协调问题,这为2023年经济增长奠定了很好基础。预计今年经济增长从现在开始触底回升,一季度有所回升,二、三季度增速进入快速发展时期。
赵萍:消费拐点已经出现将逐渐回稳
中国贸促会研究院副院长 赵萍 中新社记者 田雨昊 摄
官方数据显示,2022年,中国社会消费品零售总额439733亿元,比上年下降0.2%。全国网上零售额137853亿元,比上年增长4.0%。
中国贸促会研究院副院长赵萍对中新社国是直通车表示,随着疫情防控政策的优化及复工复产,疫情对商业、服务业影响非常大的时期已经过去,未来景气度回升是必然趋势。“我认为中国消费的拐点已经出现,并且将进入上升通道。”
她提到,中国消费者线上消费习惯不断强化,线上消费占比持续提高。而在线上消费实现较快增的同时,线下一些业态,特别是保障类业态增长态势非常稳健。
面向未来,赵萍认为,中国消费市场基础很稳,从各季度、各月份走势来看,持续上升是未来大势。今年全年消费大势应该是逐渐回稳,前景广阔。
赵萍同时提醒,在消费市场回升过程中,对商业企业来说,要加强线上线下融合、加强内外贸融合、加强跨产业融合;在服务对象上,既要关注有更多创新意识的“Z世代”消费者,同时也要注重老龄化社会带来新的消费机遇。
倪鹏飞:房地产经历深度全面调整,正接近合理区间
中国社科院城市与竞争力研究中心主任 倪鹏飞 中新社记者 田雨昊 摄
中国社科院城市与竞争力研究中心主任倪鹏飞对中新社国是直通车表示,2022年房地产各项指标全面下行,但房地产没有“失速”,下行过程中是有波动的,有时候速度放缓。他认为,去年房地产经历了深度全面的调整,但绝不是“硬着陆”了。房地产正在接近合理的区间。
当日国家统计局发布的数据显示,2022年,房地产开发投资132895亿元,比上年下降10.0%。从销售端来看,2022年,商品房销售面积135837万平方米,比上年下降24.3%;商品房销售额133308亿元,下降26.7%。供需两端均相对疲弱。
倪鹏飞认为,对于楼市调整要辩证地看。最近十多年来,房地产高位运行是不合理的、不可持续的。房地产调整也是前期政策意图所在,不过,受到外部冲击叠加,调整加深。楼市调整过程中,不可避免要带来一定风险,如果风险能够得到较好控制,逐步释放,那么总体上,房地产调整其实是积极的。
他指出,从总量上看,房地产正在接近合理区间。由于一些长期变量,如人均住房面积、人口老龄化等问题,房地产不可能像过去一样高位增长了,“我们预判,未来十年房地产以及住房新增部分规模在10亿至12亿平方米左右,匹配相应房地产投资规模”。
对于当前房地产风险,倪鹏飞认为,房地产局部风险得到了控制,但是隐患尚未消除。当前,房地产供求形势是向好发展的,这为控制风险提供了条件。2023年及未来一段时间,如果没有意外事件冲击,房地产总体走势将是波动性弱恢复,不可能也不应大幅度增长。
中国网客户端 国家重点新闻网站,9语种权威发布 |