9月6日消息,百川百川智能今日宣布正式開源微調後的发布Baichuan2-7B、Baichuan2-13B、免费Baichuan2-13B-Chat與其4bit量化版本,可商並且均為免費可商用;此外,百川百川智能還宣布開源模型訓練的发布Check Point,並宣布將發布Baichuan 2技術報告,免费詳細介紹Baichuan 2的可商訓練細節,幫助大模型學術機構、百川開發者和企業用戶更深入的发布了解其訓練過程。
百川智能方麵表示,Baichuan2-7B-Base和Baichuan2-13B-Base均基於2.6萬億高質量多語言數據進行訓練,可商在保留了上一代開源模型的百川生成與創作能力、多輪對話能力以及部署門檻較低等特性基礎上,发布兩個模型在數學、免费代碼、安全、邏輯推理、語義理解等能力有顯著提升:Baichuan2-13B-Base相比上一代13B模型,數學能力提升49%,代碼能力提升46%,安全能力提升37%,邏輯推理能力提升25%,語義理解能力提升15%。
百川智能宣布,Baichuan2-7B和Baichuan2-13B不僅對學術研究完全開放,開發者也僅需郵件申請獲得官方商用許可後,即可以免費商用。
而百川智能宣布將公開的Baichuan 2技術報告,將詳細介紹Baichuan 2訓練的全過程,包括數據處理、模型結構優化、Scaling law、過程指標等。
延伸閱讀