四川长虹90后技术专家周杰:在拷问中不断攀登技术高峰
来自四川长虹智慧显示公司软件服务中心语音组的技术专家周杰在智能电视领域做出了创新。
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/df498ab2-ade3-4a03-9bf8-6f0f9c79ddd9.png" alt="3132643649.png"></p>
<p style="text-indent: 2em; text-align: left;">为何智能电视总是不够智能?为何用户提到一些问题、发出一些指令,电视会理解不了?为何电视没法做到人和人交流一样的自然?这是来自四川长虹智慧显示公司软件服务中心语音组技术专家周杰一直在思考的问题。</p>
<p style="text-indent: 2em; text-align: left;">如何让电视说什么都听得懂、说什么都能理解,成为家庭的智慧助手?让电视从“百事通”变为无所不能的“事事通”,电视也不再是提供什么用户就看什么,而是根据用户需求,创造内容和主动推荐服务。找到问题后,周杰也不断在思考如何解决问题。</p>
<p style="text-indent: 2em; text-align: left;"><strong>从革新到创新:</strong></p>
<p style="text-indent: 2em; text-align: left;"><strong>创新才能引领“潮流”</strong></p>
<p style="text-indent: 2em; text-align: left;">1972年12月,长虹第一台黑白电视机试制成功,后来,伴随着产品力提升以及价格优势,长虹电视在1990年拿下了中国电视机销量第一。此后,长虹如其企业名一样“气贯长虹”:1992年,长虹彩电的销售突破100万台……</p>
<p style="text-indent: 2em; text-align: left;">作为社会生活水平质量高低的标志之一,电视机的生产数量、家庭拥有量等一度成为重要指标。如今,中国电视机的生产量已经连续多年位居世界第一,电视机也已经成为中国家庭的标配。</p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/fa7ac080-b81f-4c17-9bab-15571c6f7456.png" alt="4175851236.png"></p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/cf288e22-f856-43c9-857c-c19c91d6f79e.png" alt="394712011.png"></p>
<p style="text-indent: 2em; text-align: left;">时代洪流滚滚向前,转眼来到四十四年后的2016年,自首款人工智能电视问世以来,长虹在人工智能技术上实现快速迭代,而周杰进入长虹的的时间也是2016年。进入长虹后,他主要参与电视大数据平台及用户画像平台的建设。凭借自己3年的DBA与数据库开发经验,他很快成为数据开发项目核心成员。</p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/c3d2c45e-28f3-4e64-b808-f4ebc06bf717.png" alt="2646573584.png"></p>
<p style="text-indent: 2em; text-align: left;">随着用户对电视语音功能依赖程度逐渐加深,语义理解系统也需要升级,需要利用自然语言处理算法对语义系统优化,才能更好地理解用户指令。周杰转型算法开发。但是,进入这个新领域需要进行算法的系统学习,一开始痛苦的,要理解算法的原理,需要首先掌握大量高等数学(线性代数、微积分)、神经网络、机器学习、深度学习等方面的知识。很长一段时间内,周杰在完成数据平台工作的同时,挤出午休时间与下班时间完成算法的学习,从高等数学到机器算法,再到深度算法,从课本书籍到线上课程。</p>
<p style="text-indent: 2em; text-align: left;">研发工作不是一蹴而就,是枯燥繁重的螺旋式进阶的,必须耐得住寂寞、经得起失败、不断超越自我才可能破茧成蝶、凤凰涅槃!回首那段时间,5+2、白加黑高强度地不间断实验,有点滴成功的喜悦、有失败短暂无法攻克的困惑,经过长达半年多的学习、实践,周杰掌握深度学习的原理并完成了第一个算法的开发与落地:物联控制领域的理解算法。而后,周杰又参与到自然语言理解算法的开发中,落地算法多达几十个。</p>
<p style="text-indent: 2em; text-align: left;"><strong>从功能到智能:</strong></p>
<p style="text-indent: 2em; text-align: left;"><strong>满足个性化用户需求</strong></p>
<p style="text-indent: 2em; text-align: left;">人工智能大模型技术的成熟再次将人工智能带入了一个新的时代,全球掀起了生成式人工智能的热潮。周杰说:“语音技术在电视行业4-5年就会有比较大的迭代,不进步就会‘挨打’。”如何抓住机遇,快速将技术与产品相结合,切入痛点创新产品,也是长虹面临的新挑战。</p>
<p style="text-indent: 2em; text-align: left;">2023年6月20日的发布会上,长虹再一次领先行业,率先将大模型技术应用于电视,推出全球首款生成式人工智能应用—长虹超脑,长虹电视正式开启“强人工智能”时代。</p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/c188fe9c-7fe8-4cd1-aca1-2f220c0e685d.png" alt="2925648251.png"></p>
<p style="text-indent: 2em; text-align: left;">“长虹作为一家老牌国企,但是技术不‘老’,我们一直走在自我革命,技术创新的路上”周杰谈道。在“长虹超脑”身后,一些“研发碎片”组成周杰的日常。为了给用户带来更快捷的语音交互体验,长虹语音团队设计了一种新的语音交互方式:连续对话。要实现连续对话交互,一个不能回避的问题就是:连续对话过程中的噪音拒识,比如,你在连续交互过程中,说了一句:“长虹语音太好用了!”,这句话实际应该被拒识,而,“你是谁”、“你能干什么”这些看似闲聊的指令则不能被拒识。</p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/bde31ea8-9982-48de-92dd-89a9b106b4ac.png" alt="2082121798.png"></p>
<p style="text-indent: 2em; text-align: left;">要解决这个问题,需要开发一种新的算法,由此“划清”拒识与不拒识指令的边界。周杰凭借对数据分析、算法开发的经验,对数据平台语音用户的大量历史数据进行分析,并根据数据特征,带领语音算法团队加班加点开发了多种拒识别算法,最终成功落地并搭载到多个机型上。周杰也以深厚的专业知识和卓越的研发能力,为长虹的语音技术注入了新的活力。</p>
<p style="text-indent: 2em; text-align: left;"><strong>从现在到未来:</strong></p>
<p style="text-indent: 2em; text-align: left;"><strong>技术赋能“动嘴”可及</strong></p>
<p style="text-indent: 2em; text-align: left;">从“操作”到“交互”,再到“理解”的跨越,大模型在用户使用中落地应用,创造实际价值才是关键。周杰和团队深知这一点,因此在接下来数次的头脑风暴中,他们积极献计献策,以确保能够满足用户需求。不断提了人机交互的便捷性,极大地提升用户体验。</p>
<p style="text-indent: 2em; text-align: left;">而这离不开研发团队里的工程师们日以继夜地工作。他们面对着电脑屏幕,目光聚焦在代码上,丝毫没有放松。午饭时间到了,一边吃着盒饭,一边讨论着项目进展,干劲丝毫不减。夜幕降临,整个办公室里只剩下嗡嗡的电脑声和研发人员敲击键盘的声音。周杰说:“只有通过不懈的努力才能将项目推向成功。”</p>
<p style="text-align:center"><img src="https://cmsimg.peopledigital.com.cn/2024/12/10/638ce458-c529-410f-a525-60c291b7ff3a.png" alt="3321071274.png"></p>
<p style="text-indent: 2em; text-align: left;">“问答中的问与答只是技术赋能的第一步,用大模型去解决用户的指令,用大模型+小模型+隐私指令来准确识别才是题中之意。”而对于用户来说会有怎样的变化感知?周杰用了一个简单的例子进行回答,“当你只是用一个非常模糊的语音指令来告诉你的电视,甚至在你不太确定的情况下,你都会得到一个确切的答案,比如你需要找一部忘记名字的电影,只记得一些模糊的剧情或场景,现在你可以这样对电视说:“蓝色的人骑着大鸟在天上飞的电影”,你的电视便能准确搜索到《阿凡达》这部电影。”用模糊的指令来实现确切的答案也是周杰和其团队未来的目标。</p>
<p style="text-indent: 2em; text-align: left;">接下来周杰和他的项目团队,会将精力投入到下一轮产品迭代中去,以保证软件持续性领先。(长虹供稿)</p>