近日,AAAI 2024 Global Competition on Math Problem Solving and Reasoning大賽落下帷幕,天翼云智能邊緣事業(yè)部AI團(tuán)隊(duì)?wèi){借在大模型基礎(chǔ)能力研究領(lǐng)域的數(shù)據(jù)處理與模型訓(xùn)練策略的領(lǐng)先優(yōu)勢,在眾多參賽隊(duì)伍中脫穎而出,榮獲本次競賽冠軍。
AAAI(Association forthe Advancement of Artificial Intelligence)是人工智能領(lǐng)域的國際權(quán)威學(xué)術(shù)組織,其舉辦的會(huì)議和賽事聚集全球AI從業(yè)者,是展示最新人工智能研究成果的重要平臺(tái)。
數(shù)學(xué)推理長期以來被視為檢驗(yàn)大模型能力的試金石。盡管當(dāng)前的大語言模型(LLM)在語言能力方面已經(jīng)取得了長足進(jìn)步,但在數(shù)學(xué)推理方面仍存在不足,尤其是對公式、符號和抽象圖形的理解和計(jì)算。在此背景下,AAAI 2024 Global Competition on Math Problem Solving and Reasoning競賽應(yīng)運(yùn)而生,面向全球科研機(jī)構(gòu)、企業(yè)提供競技平臺(tái),旨在測試和優(yōu)化大模型的數(shù)學(xué)推理能力。
本次競賽任務(wù)包括一系列數(shù)學(xué)問題,從基本算術(shù)到復(fù)雜的空間幾何。面對跨越多個(gè)難度、多個(gè)問題門類的數(shù)學(xué)問題,天翼云AI團(tuán)隊(duì)采用了綜合數(shù)據(jù)對齊策略(Alignment Strategy),通過探索不同數(shù)學(xué)問題的整體推理路徑(Inference Path)、精準(zhǔn)劃分和配比訓(xùn)練樣本,提升了模型性能。同時(shí),團(tuán)隊(duì)采用了高度定制化的指令(Prompt)、模型訓(xùn)練方法和后處理策略(Post-Processing Strategy),提升了模型回復(fù)一致性。
本次競賽所展現(xiàn)出的創(chuàng)新成果,已在天翼云“慧澤”政務(wù)大模型的研發(fā)和生產(chǎn)中得到應(yīng)用。在“慧澤”政務(wù)大模型的優(yōu)化中,以上數(shù)據(jù)處理和模型訓(xùn)練策略為其在政策咨詢、政務(wù)指導(dǎo)、12345服務(wù)支持等多樣化應(yīng)用場景提供了強(qiáng)大支撐,這在提升政務(wù)辦事效率的同時(shí),也促進(jìn)了“一網(wǎng)通辦、一網(wǎng)統(tǒng)管、一網(wǎng)協(xié)同”體系的智能化升級,為加速推進(jìn)城市治理現(xiàn)代化樹立了新標(biāo)桿。
人工智能技術(shù)的快速發(fā)展和廣泛應(yīng)用,正不斷打破各個(gè)行業(yè)的發(fā)展瓶頸,重塑不同產(chǎn)業(yè)的生產(chǎn)模式。展望未來,天翼云AI團(tuán)隊(duì)將持續(xù)深耕人工智能技術(shù)創(chuàng)新,加速構(gòu)建原創(chuàng)技術(shù)策源地,用更豐富、更智能的數(shù)字化技術(shù),為各行各業(yè)的數(shù)字化轉(zhuǎn)型注入新動(dòng)能。