當GPT開始連接“無聲的世界”

Vinky
0 評論 6751 瀏覽 6 收藏 11 分鐘
🔗 产品经理的核心价值是能够准确发现和满足用户需求,把用户需求转化为产品功能,并协调资源推动落地,创造商业价值

隨著ChatGPT的發(fā)展,各行各業(yè)都在受到影響。ChatGPT的出現(xiàn),也讓我們看到了它連接世界各國語言的重要作用。既然有聲語言可以做到這種程度,那么無聲語言呢?作者對其在手語翻譯上可以發(fā)揮的作用進行分析,一起來看看吧。

如今,GPT讓我們看到,它在連接世界各國語言之間的重要作用。

無論是中文、英語、法語、日語、西班牙語、葡萄牙語,還是每個國家之間不同的方言,比如國內的粵語、閩語、吳語、客家語等,GPT都可以在大量學習之后,輕松地進行翻譯交流。

然而,世界上還有一種語言,很容易被人遺忘——

那就是聾啞人生活中必不可少的「手語」。

實際上,手語也有國別與地區(qū)之分,也有各種各樣互不相通的「方言」。

要讀懂一個人的手語,真正理解他的意思,從來都不只是像看電視一角的手語翻譯者演示的那樣簡單。

那么,GPT在手語翻譯上可以發(fā)揮的作用,可以說更加讓人震撼。

也許,這種無聲的語言,在不久的將來,可能以一種全新的方式,被全世界人們看見、聽見。

01? 無法被理解的“手語方言”

手語一般分為兩種,一種是文法手語,也就是我們平時在新聞聯(lián)播或重大會議上看到的手語翻譯;

另一種是自然手語,有著不同的地區(qū)差異,相當于各地「方言」的集合。

目前,世界上有超過140種記錄在冊的自然手語。

然而,自然手語和文法手語之間沒有直接的對應關系,因為它們傳達的是概念,而不是單詞。

所以,即使是專業(yè)的手語翻譯者,由于他們學習的是文法手語,也無法很好地理解不同地區(qū)聾啞人的手語表達。

比如說,一個美國的聾啞人旅行者來到了英國,他想在一家咖啡店點一杯咖啡。

如果他用美國手語(ASL)對服務員做一個手勢,表示“咖啡”。

很有可能服務員會不明白他的意思,因為在英國,懂手語的人也可能只懂英國手語(BSL)。

在美國手語(ASL)和英國手語(BSL)的體系里,表達“咖啡”的手勢完全不同。

在美國手語(ASL)中,表示“咖啡”的動作是:兩只手做一個拳頭,然后把一只拳頭放在另一只拳頭的下方,上面的拳頭像轉動圓盤一樣畫圈圈,模仿的是用手轉動咖啡磨來研磨咖啡豆的動作。

而在英國手語(BSL)中,表示“咖啡”的動作是:用拇指和食指做一個“C”的形狀,然后在肩膀的高度向嘴巴的方向扭動兩次,模仿的是用嘴唇吹氣來降低咖啡溫度的動作。

因此,在日常生活中,聾啞人可能會遇到各種各樣的溝通障礙。這種尷尬,不僅發(fā)生在聾啞人與無障礙者之間,也有可能發(fā)生在聾啞人彼此之間。

02? 無法被看見的“非手部信息”

手語翻譯要比我們日常接觸到的口語翻譯更難。

因為口語通過聲道表達,而手語通過手、手臂、頭部、肩膀、軀干和面部部分表達。

也就是說,手語是一種多模態(tài)的語言。

它不僅包括手勢,還包括面部表情、身體姿勢、眼神等非手部信息,這些信息都需要被準確地捕捉到,并且加以分析。

目前,有不少科技產(chǎn)品做手語識別,但都無法很好地識別「非手部信息」。

比如,美國華盛頓大學兩名學生發(fā)明的SignAloud,這是一款特殊的手套,手套上有傳感器,可以感知手的位置和運動,然后通過無線信號把信息發(fā)送到電腦上,電腦把手部姿勢對應的英語單詞或短語說出來,或展示出來。

但這個技術目前只能識別美國手語(ASL),更重要的是,它只能識別手部信息。

因此,它只適用于一些簡單的生活場景,如點餐、問路等。

而對于一些復雜/專業(yè)的場景,如醫(yī)療、法律等,它的精細度就不夠了。

舉個虛構的例子。

假設有一名聾啞人被控告偷竊,他在法庭上用手語為自己辯護,但是法官和檢察官不懂手語,只能通過翻譯來理解他的話。

在一次提問中,檢察官問他是否承認自己偷了東西,他用手語回答說“我不知道”,但是他的面部表情和頭部動作表示他很困惑和無辜。

翻譯只看到了他的手勢,就把他的回答翻譯成“我不承認”。

法官和檢察官聽到這個回答,就認為他在撒謊和抵賴,對他的態(tài)度更加嚴厲和不信任。

這樣就可能影響他的判決結果和法律權益。

因此,我們需要更加重視這些非手部信息,需要更好地利用科學技術,來幫助我們理解聾啞人真實的內心世界。

03? GPT的騰空出世

由于對手語的不完全理解,導致了聾啞人在日常生活中受到極大的障礙。

而GPT的騰空出世,為聾啞人的語言交流帶來了極大的改善可能。

在方言的學習上,GPT的語言深度學習能力十分有優(yōu)勢。

它可以通過足夠多的方言文本數(shù)據(jù)來進行知識輸入,比如方言的書籍、文章、對話、歌詞等,自行學習方言的詞匯、語法、語音、語境等特征;

它可以掌握一定的方言知識,比如方言和標準語的對照、方言和地域的關系、方言和文化的背景等,更好地理解方言的含義和用法。

它還可以靈活地使用方言進行交流,根據(jù)不同的場合和對象來選擇合適的方言表達方式,根據(jù)上下文來推斷方言的意圖和情感。

在“非手部信息”的學習上,GPT的多模態(tài)識別能力可以發(fā)揮強大的作用。

它可以處理不同類型的輸入,比如文本、圖像、音頻、視頻等,現(xiàn)在You*T*、TikTok上面有大量的手語短視頻,能讓GPT快速擴展自己的手語知識面,提高手語理解能力。

GPT可以通過視頻觀察手語的動作和表情,從而學習手語的語法和語義,這比單純通過文本或圖片學習更加直觀和有效。

GPT可以通過視頻理解手語的情境和文化,從而增強手語的交流和表達能力,這比單純通過知識或規(guī)則學習更加豐富和靈活。

因此,GPT經(jīng)過大量訓練后,將為聾啞人與無障礙者交流帶來極大的便捷。

04 ?GPT成為“手語翻譯師”的意義

事實上,在GPT誕生之前,人類也已經(jīng)為聾啞人的境遇努力改變過。

比如中國第一位手語律師——唐帥,用10多年的時間,學習了全國各個地方的手語方言,為近16萬聾啞人提供了法律咨詢和援助。

他還積極培養(yǎng)聾啞律師,培養(yǎng)的學生之一——譚婷,成為中國首位通過司法考試的聾啞人。

但是,依靠人來培養(yǎng),所需的時間很長,涉及的知識面也始終有限。

而GPT可以成為一名更專業(yè)的“手語翻譯師”,為聾啞人的生活帶來更多改變。

除了法律場景,GPT還有更多可應用的場景,比如:

  • 醫(yī)療場景:GPT幫助醫(yī)生或護士更好地理解聾啞人的手語,避免診斷錯誤;
  • 救援場景:GPT幫助人們更好地理解聾啞人的手語求助信息,及時采取救援;
  • 金融場景:GPT幫助銀行工作人員準確理解聾啞人的手語,避免業(yè)務辦理錯誤;
  • 工作場景:GPT幫助聾啞人與工作中的同事或客戶溝通,用手語表達自己的需求;
  • 學習場景:GPT幫助聾啞人與課堂上的老師或同學交流,用手語提問或回答問題;
  • 借閱場景:GPT幫助聾啞人與圖書館工作人員溝通,更順暢地尋找資料;
  • 運動場景:GPT幫助教練或裁判準確理解聾啞人的手語,避免指導錯誤或判罰錯誤。

我們欣喜地發(fā)現(xiàn),GPT可覆蓋的場景愈發(fā)多元化;

我們滿心地期待,GPT可以為人類生活帶來更多有意義、有價值的幫助,人類也無需在這個科技革命面前躊躇不前,害怕墜入被AI反噬的萬丈深淵。

技術照亮生活,讓人們在困境中找到出路。

也許GPT正是那一束光,為這個“無聲的世界”帶來一絲溫暖與希望。

專欄作家

Vinky,微信公眾號:叁言梁語,人人都是產(chǎn)品經(jīng)理專欄作家。分享商業(yè)干貨,關注互聯(lián)網(wǎng)營銷領域。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載

題圖來自Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
36424人已学习27篇文章
作为AIGC的代表性应用之一,ChatGPT仅仅只用了2个月的时间就已经突破了1亿用户。
专题
15654人已学习12篇文章
本专题的文章分享了如何从0到1搭建结算平台
专题
12710人已学习12篇文章
发觉用户本能的最好方式就是从用户的心理出发,利用人的本能做产品设计,用最“自然”的方式影响用户的行为。本专题的文章分享了产品心理学。
专题
15303人已学习12篇文章
本专题的文章分享了数据产品经理的通用技能。
专题
14174人已学习13篇文章
无论是对于需求的挖掘,还是对于产品的设计迭代,用户访谈这个环节都是必不可少的。本专题的文章分享了如何做好用户访谈。