Video PlayerClose
主流價值語料庫圍繞習(xí)近平新時代中國特色社會主義思想和中國式現(xiàn)代化涉及的經(jīng)濟、政治、法治、科教、文化、民生、生態(tài)等十幾個領(lǐng)域,在對國內(nèi)外主流大模型進行安全評測的基礎(chǔ)上,針對大模型普遍遇到的意識形態(tài)安全問題,依托黨報黨網(wǎng)長期建設(shè)發(fā)展形成的權(quán)威優(yōu)質(zhì)資源,以及黨和國家重要文獻資源,科學(xué)歸集、清洗、標(biāo)注、風(fēng)控,重點建設(shè)基礎(chǔ)語料、圖文語料、問答語料等多類語料,賦能人工智能的價值觀對齊,滿足全面性、專業(yè)性、時效性、導(dǎo)向正確性的要求,為人工智能大模型的安全持續(xù)發(fā)展護航。
主流價值語料庫總體規(guī)模超過30T,其中基礎(chǔ)語料超過300億字,問答語料超過17萬對。與多個國內(nèi)主流大模型進行集成對接,糾偏效果明顯。
責(zé)任編輯: 葛燕燕