近期,ChatGPT概念席卷A股,截至2月10日,概念股中(zhōng)已有股票斬獲“7連闆”。
ChatGPT一(yī)經問世,便成爲輿論焦點,如今亦化身資(zī)本寵兒。但關于ChatGPT本身仍然存在不少疑問,這究竟是一(yī)個怎樣的技術?在AI發展的曆史長河中(zhōng),ChatGPT的誕生(shēng),究竟算一(yī)個怎樣的事件?
近日,《每日經濟新聞》記者專訪了美亞柏科(SZ300188,股價15.21元,市值130.73億元)人工(gōng)智能科學家、AI研發中(zhōng)心總經理趙建強博士。趙建強畢業于西安交通大(dà)學計算機科學與技術專業,獲得博士學位。多年來,趙建強及其研發團隊在美亞柏科從事人工(gōng)智能相關研究。
趙建強表示,2022年被業内稱爲AI生(shēng)成的元年,ChatGPT是一(yī)個裏程碑式的産品。同時,ChatGPT背後所依托的超大(dà)規模語言模型技術也将在各行各業産生(shēng)深遠影響。
“除了OpenAI的GPT預訓練模型,實際上,谷歌、微軟、Meta、百度也有推出類似的模型,但他們暫時沒有把這些功能開(kāi)放(fàng)成一(yī)個聊天機器人。”趙建強告訴記者。
是AI文本生(shēng)成領域的裏程碑
“在文本理解和智能問答技術方面,ChatGPT是一(yī)個裏程碑式的産品。”趙建強說。
記者注意到,ChatGPT之所以能夠火(huǒ)爆出圈,重要原因是其交流的流暢度和知(zhī)識的豐富程度比之前的類似産品有很大(dà)提高。
“在業界,我(wǒ)(wǒ)們把2022年稱爲AI生(shēng)成的元年,不僅是ChatGPT,實際上OpenAI還開(kāi)放(fàng)了圖像生(shēng)成的一(yī)些模型(DALL•E 2),隻是沒有像ChatGPT這麽熱。ChatGPT在AI生(shēng)成内容方面或者AI創作方面是一(yī)個裏程碑的節點,是比較有影響力的一(yī)個階段性成果。”趙建強認爲。
他介紹,ChatGPT的相關技術模型此前早已有之。“OpenAI之前就發布了ChatGPT的大(dà)語言模型。ChatGPT實際上是基于GPT-3.5這個版本的超大(dà)規模自然語言預訓練模型,之前已經發布過GPT1.0、2.0和3.0版本,現在用的是GPT-3.5的版本。ChatGPT基于GPT模型,利用人類反饋強化學習訓練的方式,學習人類提問機器答、機器提問人類答等模式,不斷訓練叠代,以實現智能對話(huà)聊天功能。”
趙建強向記者解釋:“ChatGPT交流得非常順暢,基本上聊到的内容都能回答,這主要得益于其具有的超大(dà)規模自然語言預訓練模型GPT3.5,模型在訓練時使用了海量人類在互聯網上所編輯生(shēng)成的多種類文本數據集。OpenAI的官方介紹顯示,GPT訓練使用了超萬億級單詞量的數據。此外(wài),模型的參數規模也非常大(dà),3.5版本的參數規模就達到了1750億。目前來看,可能隻有一(yī)些AI超級巨頭才具備這樣的數據量和計算能力。”
趙建強認爲,由于具備了生(shēng)成能力,ChatGPT将會對很多行業産生(shēng)影響。
“以前我(wǒ)(wǒ)們理解的AI更多處在計算智能和感知(zhī)智能階段,比如圖像識别、人臉識别、文本觀點分(fēn)析等。現在AI已經具備認知(zhī)智能的能力,可以根據命令需求,創作生(shēng)成各類文稿、文案,也可以通過文本場景描述生(shēng)成圖像和視頻(pín)。所以說以後AI在内容生(shēng)成創作、文本生(shēng)成文本、文本生(shēng)成圖像、文本生(shēng)成視頻(pín)等方面,都具有廣闊的應用前景。ChatGPT解鎖了多樣化的文本内容生(shēng)成能力,帶來AI創造世界更豐富的想象空間,将會應用于文本理解、文本創作、文案撰寫、知(zhī)識推理、翻譯、智能客服、文本生(shēng)成圖像,代碼理解、審查和生(shēng)成等多個方向,具體(tǐ)跟一(yī)些行業應用結合起來,将會産生(shēng)比較大(dà)的行業影響。”趙建強表示。
利用大(dà)語言模型反詐騙
此前,美亞柏科在投資(zī)者互動平台上表示:“公司從2020年開(kāi)始關注這類AI技術濫用與犯罪的行爲,研究對深度合成内容的檢測識别和鑒定相關技術,研發了針對視頻(pín)圖像僞造生(shēng)成檢測鑒定的産品,積極參與人工(gōng)智能合成和生(shēng)成技術合規應用的行業标準的制定,協助執法部門維護網絡空間安全,規範人工(gōng)智能技術的良性發展。”
趙建強所在的部門一(yī)直在從事AI方面的研究。“以ChatGPT爲代表的超大(dà)規模語言預訓練模型技術出現之後,大(dà)大(dà)推動了AI業務,特别是AI生(shēng)成内容類業務落地的進程。”
美亞柏科的主要業務領域包括電子數據取證、大(dà)數據智能化、網絡空間安全、智慧城市等。
“我(wǒ)(wǒ)們的做法也類似,我(wǒ)(wǒ)們采用‘超大(dà)規模預訓練模型+下(xià)遊任務遷移’的技術思路,利用超大(dà)規模的語言預訓練模型,再結合具體(tǐ)的項目和數據,訓練形成具有行業特色的應用模型。實際上,美亞柏科在自然語言處理、OCR、計算機視覺以及人工(gōng)智能安全這些領域已經開(kāi)展了多年的業務實踐,基于在電子數據取證和執法部門大(dà)數據智能化領域多年的深耕和知(zhī)識經驗的積累,對行業客戶數據特點和業務需求的深刻理解,提出了文本智能分(fēn)析理解、不良多媒體(tǐ)文件分(fēn)析、反詐騙信息鑒别、多模态信息檢索等多個獨有的核心算法模型,并已經在打擊犯罪、社會治理、智慧城市建設等方面發揮了實戰價值。”趙建強稱。
比如在反詐騙領域,大(dà)語言模型的識别效果要遠超此前的識别模型。趙建強提到:“比如之前面對小(xiǎo)模型或者小(xiǎo)數據量的情況下(xià),在文本的理解和識别上所實現的效果不是很理想,超大(dà)規模語言預訓練模型技術将有效推動這類業務落地。”
“通過利用已有的大(dà)規模語言預訓練模型,結合詐騙場景下(xià)的語言特點,我(wǒ)(wǒ)們就可以去(qù)學習訓練相關的識别模型。詐騙通常是通過文本聊天交流,具有一(yī)定的語言特征,也就是詐騙話(huà)術,在理解這些話(huà)術之後,再去(qù)檢測識别。”趙建強說。
趙建強繼續解釋:“比如有些受害人會被拉到一(yī)些所謂的理财群裏,詐騙人員(yuán)以推銷交流虛假理财投資(zī)産品的名義誘導受害人。我(wǒ)(wǒ)們就可以通過訓練針對投資(zī)理财類聊天文本識别模型去(qù)鑒别,如果出現類似内容就可以檢測出來。還有一(yī)類就是識别發現各種詐騙網站,通過對詐騙網站網址、頁面文本内容、圖像内容等的特征學習,訓練形成針對不同類别詐騙網站識别的模型,提升海量網站數據中(zhōng)打擊詐騙網站的能力。目前,我(wǒ)(wǒ)們已經把這些技術和能力應用到了反詐預警當中(zhōng)。”
此外(wài),有不少投資(zī)者也在投資(zī)者互動平台上問及美亞柏科的相關業務。美亞柏科回複稱:“公司将ChatGPT的相關技術融合應用到産品售後支持部門,基于取證産品知(zhī)識庫,研發智能客服機器人系統,提升服務水平。公司将在國家相關法律法規許可的框架下(xià)持續關注、研究、利用ChatGPT等新技術,并與公司大(dà)數據智能化、電子數據取證等業務融合,積極參與相關行業标準制定,并适時布局新業務。”