新華社技術(shù)局技術(shù)研發(fā)中心主任成鵬
近年來,技術(shù)創(chuàng)新成為推動媒體融合發(fā)展的重要的推動力,作為主流媒體的技術(shù)人我有幸多次參與新聞記聯(lián)的王選獎評選工作,見證了媒體的技術(shù)進(jìn)步與發(fā)展,接下來向大家分享我的經(jīng)驗(yàn)和思考。
首先讓我們通過分析王選獎的獲獎項(xiàng)目來探討一下媒體行業(yè)技術(shù)發(fā)展變化的趨勢。先介紹一下王選獎。王選獎是王選新聞技術(shù)獎的簡稱,旨在表彰在新聞、出版、傳媒、科技領(lǐng)域作出杰出貢獻(xiàn)的個人和組織。通過對近十年來共計(jì)485個獲獎的王選獎進(jìn)行分析,我們可以看到,媒體機(jī)構(gòu)技術(shù)發(fā)展的過程分成兩個階段,第一個階段是數(shù)字化建設(shè)階段,在媒體融合的初期,各大媒體機(jī)構(gòu)通過建設(shè)海量存儲,高速網(wǎng)絡(luò),高性能計(jì)算,融媒體生產(chǎn)平臺實(shí)現(xiàn)了云網(wǎng)化和生產(chǎn)流程的數(shù)字化。第二個階段是智能化發(fā)展階段,伴隨著媒體融合向縱深發(fā)展,媒體機(jī)構(gòu)順應(yīng)時代潮流,發(fā)展重點(diǎn)向全媒化,社交化和智能化發(fā)展。這一階段新聞生產(chǎn)智能化成為最顯著的特點(diǎn),從統(tǒng)計(jì)數(shù)據(jù)來看獲獎的智能化項(xiàng)目的數(shù)量呈逐年上升的態(tài)勢。
接下來以2021年榮獲王選獎一等獎的項(xiàng)目新華智媒工程向大家展示新華社在智能化應(yīng)用上取得的成果。智能化當(dāng)中,我們圍繞新聞生產(chǎn)的6個環(huán)節(jié)實(shí)現(xiàn)了新聞生產(chǎn)流程的智能化,構(gòu)建了全媒體的智慧中臺,研發(fā)了191項(xiàng)先進(jìn)技術(shù)賦能工具。
新華較真是基于新華社的權(quán)威數(shù)據(jù)和先進(jìn)的人工智能算法,我們研發(fā)的一款符合主流價值觀的智能審校平臺,較真在政治術(shù)語、敏感詞、敏感標(biāo)識、地圖等標(biāo)識上的識別表現(xiàn)突出,目前較真已經(jīng)通過了國產(chǎn)化的信創(chuàng)認(rèn)證,全面實(shí)現(xiàn)了多A組,多模態(tài),多場景的內(nèi)容審校,值得一提的是新華社的編輯每天都在使用新華較真,也使得較真可以持續(xù)的學(xué)習(xí)業(yè)界最佳的表述數(shù)據(jù),進(jìn)而保持其準(zhǔn)確性的持續(xù)提升。這里還要介紹一下技術(shù)賦能新聞產(chǎn)品制作的情況。當(dāng)下新技術(shù)融入了新聞產(chǎn)品當(dāng)中,成為新聞供給側(cè)解決的重要的語義,近年來新華社努力實(shí)現(xiàn)內(nèi)容+技術(shù)+靈感+美學(xué)的有機(jī)統(tǒng)一,研發(fā)了五大類超過了百余款的產(chǎn)品,以智能化為代表新技術(shù)在賦能新聞業(yè)務(wù)方面取得了顯著的成果,當(dāng)然看到成果的同時,我們也要看到面臨新的挑戰(zhàn)和問題。2020年英國衛(wèi)報(bào)利用GPT3模型生成一篇評論文章,從那時起GPT就開始撬動了媒體人的神經(jīng),隨著ChatGPT的問世,我們進(jìn)一步感受到媒體融合是一場持續(xù)深入系統(tǒng)的變革,為了在變革中贏得主動需要著力解決以下突出問題。
一是技術(shù)上卡脖子問題,二是傳播上卡嗓子問題,三是議題上的牽鼻子問題。這些問題在以往也存在,大模型之后讓這些問題更具有挑戰(zhàn)性,面對問題和挑戰(zhàn)媒體技術(shù)人迎難而上,從2020年以來開展大模型研究,同時我們認(rèn)為媒體融合的技術(shù)發(fā)展進(jìn)入了一個新階段,即:大模型再造階段。2021年啟動了新融合工程,圍繞新搜索、新模型、新標(biāo)尺、新范式開啟了新一流流程采編再造。
第一個新,新搜索,即多模態(tài)、跨模態(tài)搜索,我們對外合作基于新華社圖文數(shù)據(jù),訓(xùn)練多模態(tài)大模型,實(shí)現(xiàn)了以圖搜圖搜視頻,以文搜圖搜視頻,既實(shí)現(xiàn)了基于語義的智能搜索功能。比如我們要做一個反映新疆人民幸福生活的圖片新聞,傳統(tǒng)的搜索僅靠搜索文字找不到可用的素材,現(xiàn)在通過新的多模態(tài)搜索技術(shù)在同樣一個數(shù)據(jù)庫,我們搜新疆人民的幸福生活可以看到大量的符合我們需求的有效素材,可見新的技術(shù)挖掘了歷史數(shù)據(jù)的新價值。
第二個新是新模型,即生成式大模型,基于開源模式,利用新華社高質(zhì)量數(shù)據(jù)級,以及質(zhì)量級,打造了近百億參數(shù)的mediaGpt大模型,已經(jīng)實(shí)現(xiàn)了新聞評論,新聞大綱的內(nèi)容生成。
以美食帶動旅游生成一篇評論,經(jīng)過我們的編輯測評,這個模型在新聞中文場景生成效果優(yōu)于ChatGPT,也說明高質(zhì)量的數(shù)據(jù)級對模型的生成效果有顯著的影響,后續(xù)我們將向可控的文本生成,和300億或者更大參數(shù)的模型發(fā)起挑戰(zhàn)。
第三新是新標(biāo)尺,我們需要找到一個分辨真假的技術(shù)標(biāo)尺,防止虛假信息進(jìn)入我們稿件庫,為此我們研發(fā)了AI生成檢測識別工具,目標(biāo)就是既要研制導(dǎo)彈,也要建立反導(dǎo)防御系統(tǒng),努力打造大模型時代攻防一體的武器庫。
第四個新,新范式,我們積極與編輯部門合作,共同探索實(shí)踐出AI生成視頻的新聞生產(chǎn)新范式。過去制作一分鐘短視頻大約需要兩三周時間,現(xiàn)在從腳本制作,分鏡頭,音效,配音,特效每個環(huán)節(jié)實(shí)現(xiàn)機(jī)器生產(chǎn),制作時間壓縮到三天。這個AI視頻發(fā)布到推特以后廣受歡迎,受到了外交部領(lǐng)導(dǎo)的點(diǎn)贊和轉(zhuǎn)推。我們認(rèn)為大模型等新興技術(shù)為媒體融合帶來新機(jī)遇,希望推動媒體融合贏得新一流采編流程再造的先機(jī),塑造技術(shù)賦能新聞業(yè)務(wù)的新格局。