彩神邀请码|彩神官方
彩神交流群2023-01-31 16:05

彩神邀请码

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

刘跃进的谦和与《从师记》的严苛——写在“《从师记》暨新时代学者散文研讨会”前******

  顾友泽

  刘跃进先生的新作《从师记》出版,拜读之后,收获颇丰。《从师记》是一部散文集,主要记载先生的求学经历以及与此相关的人与事。虽然是以自己的个人经历为线索,然而内容却异常厚重,这是因为作者早年生活的“那个时代,激情澎湃,如同我的名字,一直在‘跃进’中”,在介绍自己的求学经历时,不可避免地反映那个波谲云诡亦且波澜壮阔的时代。而且,作者转益多师,其所师从或交往者大多为学界名流,本身就有很多为人关注的事迹。如此种种,决定了该书的内容必然不同凡响,精彩纷呈而浑厚淳雅。

  虽然作者并不刻意抒情,甚至在情感表达上非常地节制,但这部《从师记》还是给读者带来了很多的感动与感慨,比如作者因母亲的提醒而失去了也许会产生美好爱情的机会而心情复杂就令人唏嘘,作者对自己早年学业先天不足而导致不得不放弃作家梦想的描述同样引起很多同龄人的共鸣,至于其在艰难环境中备战高考时表现出的坚韧不拔的意志更是令人感动。然而,最令我感动的是作者对学术尊严的维护与学者交往之间的温情。

  作者对学术与学者的尊严非常看重。他在《斯人已逝,德音未远》中谈到自己作为大三的学生看到傅璇琮先生的《唐代诗人丛考》时的感受:“我并不能完全读懂,但可以读出学术的厚重与学者的尊严,那是我向往的境界。”而作者自己到扬州大学讲学后,也同样得到了这样的赞誉,王小盾先生在给作者的信中写道:“中国古代文学研究的深厚博大,其尊严及其生机,都由你谦和地表达出来。” (《求其友声三十年》)

  正是出于对学术尊严的维护,面对良莠不齐的学术界,作者忍不住对当前学术弊端提出严苛批评,其在《裴斐先生的傲骨与逸情》中指出当前学界存在消解经典,或者躲避经典,同时:

  在方法上,因循守旧,为论文而论文,为学位而学位,缺乏学术个性,更缺乏活的灵魂。在态度上,仰慕洋人,唯洋人马首是瞻,洋腔洋调。在结果上,书是越来越多,垃圾也越来越多。

  又在《从师记》中说 :

  现在有些专著,往往连概论都不如,只是依据既有的知识,预想一个题目,然后利用现代手段收集相关资料,拼凑成书。这样的成果,或许能给作者带来一定好处,对学术界来讲,几乎没有借鉴意义。

  作者平时与人交往温文尔雅,几乎未曾见其动怒,但是对学术界的不良风气,却还是直言其弊,体现出维护学术尊严的高度责任感。

  那么,如何维护学术的尊严呢?作者通过介绍自己所崇敬的师长,具体而形象地给出了答案。

  首先,维护学术尊严就要尊重学术本身。作者认为,学术本身是厚重的、博大的,无论是谁都无法全部把握,因而面对学术,始终要保持着谦卑之心。其在《好诗不过近人情》中谈到自己在杭州大学学习的体验:

  这些课程,内容浩繁,一时难以消化,但是它却向我打开了一扇窗,可以真正感受到世间学问的博大浩繁。

  在《从师记》中又写道:“大千世界,图书无限。一个人终其一生,也读不了多少书。”一个人取得的成就,面对既广且深的学术殿堂,何其渺小。故作者引用罗宗强先生的话说:“现在很多教授还不明白山外有山的道理,以为自己写了几本书就是专家。”学术研究如果局限在自己的小天地中,故步自封,结果必然是一叶障目,不见泰山。作者又引用姜亮夫先生的话:“登高望远,你才会知道世间学问的博大,自己的渺小,没有任何理由骄傲。”(《记忆中的水木清华》)面对学术,学者理想的状态应该像傅璇琮等先生那样“学问既深,义气自平。”作者赞美这样的状态,亦追随前辈的风范。

  基于这样的认识,作者认为,做学术研究最重要的是有学术品格。在这本书中,作者对师长们严谨的学术态度、扎实的文献基础、恢宏的视野、高度的文化责任感、坚强的毅力等不厌其烦介绍。介绍姜亮夫先生,写其临终前对学生的“最后最高要求”,令人感佩不已。记录叶嘉莹先生之论:“如果说实践是检验真理的唯一标准,那么真诚则是追求真理的重要途径。做人做事要真诚,学习钻研要真诚。真诚是做人的重要标准,古代这样,今天也是这样。”彰显出叶先生修辞立诚的风范。而记叙罗宗强先生指导作者写作学年论文的详细经历,则让我们看到罗先生一丝不苟、严谨到近于苛刻的程度的形象,而罗先生的学术品格也呈现在我们眼前。尤为令人感动的是,作者专门为既没有显赫的家世与名声,也没有令人瞩目的成就的社科院文学所图书馆主任汪蔚林先生作传,表彰其甘于奉献、勤勤恳恳,以专业的精神服务文学所的学者的事迹。在作者的眼中,学术分工并无高下之别,敬业的精神都值得人尊重。

  其次,维护学术的尊严就要求学术研究本身不俗。作者在《记忆中的水木清华》中特意援引王国维的话:“大抵学问常不悬目的而自生目的,有大志者未必成功,而慢慢努力者反而有意外之收获。”作者阐释说:

  王国维先生就是想告诉学生,做任何事情都不要有太强的功利性和目的性。正如陈寅恪先生所说:

  “士之读书治学,盖将以脱心志于俗谛之桎梏,真理因得以发扬。”

  又在《从师记》中引用钱穆的话:

  我生平做学问,可说最不敢爱时髦或出风头,不敢仰慕追随时代潮流,只是己性所近,从其所好而已……世局有变,时代亦在变,三年五年,十年八年,天地变,时髦的亦就不时髦了。所以不学时髦的人,可不求一时群众所谓的成功,但在他一己亦无所谓失败。

  作者高度认可这些说法,并且身体力行,其学术研究,不务空言,言必有得,往往能够从文献的细枝末节中发现历史的某些真相。而其对当下学子攻读博士学位的目的,也提出自己的看法:

  通过三年的专业学习,我们的学生真正了解到中国文化的博大精深,无论从事什么工作,都会有益处。开卷有益,没有白费的工夫。重要的是要阅读,要有积累,不能有太强的功利目的。

  学术不仅不是追求世俗利益的工具,甚至学术本身并不带有目的,是无用之用。

  再次,维护学术的尊严要求学术研究者能够做融通的学问。钱穆在《中国文化与中国文学》中说:“欲求了解某一民族之文学特性,必于其文化之全体系中求之。”学术如果格局太小,很容易造成盲人摸象的局限。只有将局部放到整体中考察,才能真正发现局部的特征与意义。作者接受众多名师的亲炙,提出学术不能流于琐碎饤饾,支离破碎。其认为学术研究中的文学研究应该遵循刘知几《史通》中提出的才、学、识三者并存的原则,并阐释说:“才就是艺术感受,学就是文献基础,而识则是理论素养。”而当下有些研究,“仅就某一点而言,似乎有一得之见,但是,倘若通盘考察,就不是那么回事了”。(《好诗不过近人情》)这样的研究,是不足为观的。相反,作者赞同这样的研究:“也许他们所研究的对象可能是一个很小的题目,但是在这课题的背后,你却感受到坚实厚重的学术支撑。”(《好诗不过近人情》)这些观点,正是师长们对作者耳提面命的结果。罗宗强先生教导说:“工夫要扎实,但不要钻牛角尖……思想还是开阔些好。”(《从师记》)姜亮夫先生在古籍整理专业研究生培养方案中说:“不要培养电线杆子式的专家,而是粗通中国文化的学人。”(《从师记》)在“最后最高要求”中提出:“培养自己‘普照’整个专业与中国全部文化史的能力”“不做支离破碎的学问。”(《记忆中的水木清华》)曹道衡先生起草的《先秦两汉文学博士生培养计划》提出:“应强调史料和作品本身,坚决反对空谈、人云亦云及发奇谈怪论。”(《从师记》)作者就硕士论文求教于魏隐儒先生,得到的答复是不赞成写空洞的诗文评类的文章。傅璇琮先生提出:

  学术著作,包括社会科学与自然科学,应该似一级一级的楼梯,要扎实,便于扶着向上,使人能“更上一层楼”,以便“欲穷千里目”,而绝不能是用花纸包扎的虚阶,看起来颇能目迷五色,但一踏上,就会使人跌下,害人不浅。(《斯人已逝,德音未远》)

  受到众前辈的影响,作者也特别重视学术中研究资料的编纂,也多次介绍前辈学人在这方面的贡献,又现身说法,启人深思。

  学术之外,《从师记》这部书带给我的感动,是作者与众师长之间的情感。毫无疑问,作者对书中所介绍的师长怀有深深的感激,在《引言》中,作者写道:

  在我过去四十多年的求学经历中,老师们的影响既广且深……我很景仰他们,也很感念他们,很希望有更多机会将这种感念之情表而彰之。

  将众多师长的人格风范与学术成就记录下来本身就是情感的表达。而且,读者很容易发现,作者在很多篇章中都使用“感念”“感佩”这样的字眼,看得出作者是一位很容易动情的人。他在昆明偶遇魏隐儒先生时,表现得“喜出望外”(《“小室无忧”》),对于王继权先生的帮助,作者心存感激,“小子何德何能,竟能得到王老师常年的垂青,实属不易。”(《来谕惓惓,亲如促叙》)然而,我们又很容易注意到,作者在表达情感时却并不热烈,而是点到即止。

  同样的情况,也发生在众师长的表现中。姜亮夫先生对清华大学及清华导师有深厚的感情,因为作者来自于清华,特意将其召至家中长谈。姜亮夫先生深情回忆在清华的学习与生活,言语中充满无限怀念与感激,“姜老经常感叹说自己曾在多所大学任教,再也没有遇到清华这样的好学校了”(《记忆中的水木清华》)。然而,姜亮夫先生直接的抒情并不太多,谈得更多的还是清华导师的学术与对其教导的经历。

  我想,这大概就是学者表达情感的方式,深沉而内敛。作者报考曹道衡先生的博士,是通过傅璇琮先生介绍的。曹道衡先生在病榻前告诉作者,他无意中翻出了当年傅璇琮先生当年的推荐信,并说出院后找来送给作者作纪念,后因曹先生去世而未能如愿。这是一件非常小的事,但从这件事中我们看到曹先生与作者情感之细腻,以及对于师生、同道间情谊的珍视。作者与众师友的交往,因学术而结缘,其淡如水,而这也正是众师友平时待人接物的态度。傅璇琮先生嘉惠学林,助人无数,在学界影响甚大,然而其八十岁大寿的庆祝场面冷清异常,因为傅先生事先约法三章,不允许大事铺张,这正是本色学者的处世之道。

  作者笔下的师长及作者自己,往往将对自己帮助与教导的母校、师长的感激当成自己宝贵的人生财富,将之作为一种精神传递给后人。姜亮夫先生曾很庄重地对刘跃进先生等人说:“清华导师也是你们的祖师,要不辱使命。”对学校的热爱、对老师的尊重与回报,最重要的,不是口头的称颂,也不是平日里的嘘寒问暖,而是将学校与老师的良好的风气传承下来,发扬光大,影响一代代学子,斯文不坠。有感于此,作者自己对教师这个职业也有明确的要求:“如今,我也是一名老师,也要像王老师那样,努力工作,培养学生,多出成果,这也许是对王老师的最好回报。”(《来谕惓惓,亲如促叙》)事实上,除此之外,作者还利用社科院文研所的平台及个人的影响力将年轻的学者组织起来举办读书会等活动,指导年轻学者,促进学术的繁荣。作者认为:“我现在依然持有这样的看法,一个年轻学者,能够得到前辈的扶持,确实会影响一生。”至于这本《从师记》,更是将师长所授与自己的心得毫无保留地贡献给学界,嘉惠学林,功莫大焉。我想,作者是将自己对师长的感激转化成了另一种形式,变成了指导、提携后进的动力。学术人的温情,大概就是通过这样的方式一代一代传递着吧。

  作者在《记忆中的水木清华》中写道 :

  水有源,树有根。一个人能走多远,要看他与谁同行;一个人有多优秀,要看他有谁指点;一个人有多成功,要看他有谁相伴。

  《从师记》这部书,从某种意义上讲,就是指点、陪伴我们这些后学在学术道路上前行的无声导师,也是直观展现学术的尊严与温情的舞台。我们感动于刘跃进先生勤勉好学的精神,羡慕其受教于众多饱学之士,更感激其金针度人。薪火相传,此之谓欤?

  (作者系文学博士,南通大学文学院教授, 南通大学诗学研究中心主任。)

中国网客户端

国家重点新闻网站,9语种权威发布

彩神地图