向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
航天科技集团2023年计划安排60余次宇航发射任务******
《中国航天科技活动蓝皮书(2022年)》发布 今年计划安排60余次发射任务
1月18日,中国航天科技集团发布《中国航天科技活动蓝皮书(2022年)》。《蓝皮书》显示,航天科技集团2023年计划安排60余次宇航发射任务,发射200余个航天器,开展一系列重大任务:载人空间站工程进入应用与发展阶段,空间站转入常态化运营模式,将完成1次货运飞船、2次载人飞船发射任务和2次返回任务;全面推进探月工程四期和行星探测工程,开展嫦娥七号、天问二号等型号研制;发射多颗国家民用空间基础设施科研卫星和业务卫星;完成长征六号丙运载火箭首飞,进一步完善长征火箭型谱。
《蓝皮书》指出,2023年是全面贯彻落实党的二十大精神的开局之年,也是加快建设航天强国、奋力实现建军一百年奋斗目标的关键一年,中国全年计划实施近70次宇航发射,有望再次刷新纪录。
宇航发射和飞行试验次数持续保持高位
据介绍,航天科技集团今年计划安排60余次宇航发射任务,发射200余个航天器,长征系列运载火箭累计发射次数将突破500次。其中,重大工程任务依旧繁重,要完成天舟六号、神舟十六号、神舟十七号3次发射任务,不断提高进出太空、利用太空、探索太空的能力;北斗三号全球卫星导航系统将完成3颗备份卫星发射,进一步增强系统可靠性;将发射风云三号06/07星、环境减灾二号06星、高轨20米SAR卫星、新一代海洋水色观测卫星、中星26号、中星6E、澳门科学一号A星等,让航天技术更好地服务社会民生,服务国民经济发展建设;航天科技集团“新一代商业遥感卫星系统”将加速推进建设,今年计划再发射7颗四维高景系列卫星,为传统、新兴市场用户提供高时效、高性能的时空信息服务。
航天科技集团今年还将实施宏图一号、吉林一号、吉利星座、微厘空间北斗低轨导航增强系统组网星等商业发射任务,公开发布火箭运载余量信息,向商业用户提供发射和搭载机会,为各类客户提供快速、稳定、可靠的“一站式”发射服务,推动我国商业航天持续健康发展。
研制应用任务持续保持高强度
今年将全面推进探月四期和行星探测工程,开展以嫦娥七号、天问二号、静止轨道微波探测卫星等为代表的多个型号研制工作,完成多项商业航天和整星出口合同履约工作;面向国家重大战略和经济社会发展需要,不断提升卫星应用融入新兴领域,支持重点区域经济发展;在北斗领域实现北斗应用向系统集成和增值服务延伸,继续深耕民航,拓展能源、应急等关键行业;发挥天地一体化优势和卫星通信、导航、遥感综合应用优势,聚焦行业和地方政府智能化升级契机,构建一体化的产品体系和业务综合应用解决方案。
建设航天强国新征程开启全面
《蓝皮书》显示,中国已经全面建成了航天大国,进入世界航天强国行列,开启了全面建设航天强国新征程。从近5年发射趋势看,中美两国发射活动快速增长,发射次数交替领先,发射航天器质量持续攀升,成为世界航天增长的主要动力。
2022年,中国全年完成64次发射任务,研制发射188个航天器,总质量197.21吨居世界第二位,各项数据均创历史新高。其中,长征系列火箭53次发射全部成功,并实现128次连续发射成功。
纵观这一年的中国航天,在发射活动方面,高密度发射任务有序实施、成功率保持高位,航天器研制发射数量快速增长、研制能力大幅提升,发射活动保持增长态势、进入空间利用空间能力跨越式发展。
·科技创新方面
运载火箭、载人航天、月球和深空探测、应用卫星、科学和技术试验等领域不断创新突破,取得多项重大科技成就,推动航天科技自立自强。
·应用服务方面
北斗导航服务全球,中星、亚太提供连续服务,空间基础设施形成全天时全天候对地观测能力,各类应用卫星提供的通信广播服务、国土资源服务、海洋资源服务、气象观测服务、应急管理服务、农业生产服务、生态环境服务、交通运输服务、科教文体服务等,在经济社会发展各领域发挥了巨大作用。
·国际合作方面
开展了设施和数据共享、技术合作、应用服务、交流研讨等多种类型的多边、双边合作,积极促进国际交流、产业发展和技术应用。在商业航天发展方面,产业体系和市场体系初步形成,由基础制造、产品研发为主的阶段进入应用牵引、市场主导的新发展阶段,商业航天正加快成为航天强国建设的重要力量。
(总台央视记者 崔霞 李厦 徐静)
(文图:赵筱尘 巫邓炎)