为了让众多以地方方言为载体的区域历史、文化和习俗可以以短视频的形式制作、传播与保存,解决地方方言难以被更多用户阅读和理解的障碍。近期,抖音正式上线了地方方言自动翻译功能。创作者可以使用该功能,“一键”将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕,方便公众观看。
随着短视频的不断普及,越来越多以地方方言为载体的视频出现在了短视频平台。这些极具地方特色的视频,一方面让广大用户欣赏到了山南海北不同区域的口音与特色腔调;另一方面,也因为方言识别的天然障碍,使其难以更好地被深度了解和传播。
为此,抖音近期正式上线了地方方言自动翻译功能。创作者可在抖音投稿主界面点击“拍摄上传投稿”,上传视频后,使用“自动字幕”功能,选择“转为普通话字幕”,新功能即可完成对视频内容的方言语音自动识别,并将视频里的方言内容转化成普通话字幕。目前,新功能第一期已经上线,支持粤语、闽语、吴语(上海)、西南官话(四川)、中原官话(陕西、河南)等,未来还将支持更多方言转化。
据悉,由于各地方言常以口语形式流传,可用于模型训练的方言语料数据较少,对方言识别和翻译都提出了很大挑战。对此,来自火山引擎的技术团队采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。“基于日常服务抖音集团业务的技术积累,抖音方言字幕可实现超低延时和高准确率”,其团队负责人表示。
全国汉语方言学会副会长兼秘书长刘祥柏认为,普通话是我们国家法定通用语言,普通话以汉语方言为基础,在形成过程中长期从方言中吸取养分,方言与普通话相辅相成,都是中华传统文化的重要载体。“方言就像古建筑,要保护勿强拆”。刘祥柏表示,首先,以方言为载体的“乡音”是“故乡的情感符号和情感纽带”;其次,熟练掌握方言,有利于学习、掌握古汉语,有利于把握方言与普通话的对应规律,熟练掌握普通话;第三,汉语方言是地方文化的语言载体,“各地民歌、民谣、民谚以及快板、鼓书、说唱等,依赖于方言才能具有押韵、谐音等效果,才可以体现其基本的声腔特色和地方韵味。”
抖音平台治理相关负责人表示,将持续用技术记录真实而美好的生活,未来会继续升级方言自动翻译功能,服务以方言为载体的各地文化传播。