国产精品免费无遮挡无码永久视频-国产高潮视频在线观看-精品久久国产字幕高潮-国产精品99精品无码视亚

AMEYA360報道:昆侖芯在大模型場景的規模落地實踐

發布時間:2023-3-31 15:31    發布者:Ameya360
  ChatGPT及大模型技術大會上,昆侖芯科技研發總監王志鵬表示:“作為一家芯片公司,需要對市場的需求和變化非常敏感,才能使硬件產品始終精準匹配主流需求。”

  大模型對計算的要求主要體現在三個方面,一是算力,二是互聯,三是成本。就大模型而言,昆侖芯科技在產品定義上已經做出布局——相較第一代產品,昆侖芯2代AI芯片可大幅優化算力、互聯和高性能,而在研的下一代產品則將提供更佳的性能體驗。

  昆侖芯科技成立于2021年,前身為百度智能芯片及架構部。在實際業務場景中深耕AI加速領域已逾10年,專注打造擁有強大通用性、易用性和高性能的通用人工智能芯片。

  在持續推進核心技術攻關的同時,昆侖芯科技緊密關注科技前沿,精準匹配市場需求。目前,公司已實現兩代通用AI芯片的量產及落地應用,在互聯網、智慧金融、智慧交通等領域已規模部署數萬片。“來自真實場景”一直是昆侖芯科技最獨特的身份標簽,也是其規模部署數萬片、在行業內“領跑落地”的核心優勢所在。

  王志鵬認為,只有基于真實業務場景中的數據進行端到端優化,才能順利推進大模型落地。

  目前市場上主流的大模型以Transformer架構為主,包含Encoder和Decoder。Encoder主要被應用于各類NLP的判別類任務;而Decoder更多被應用于翻譯、圖文生成等場景,最近出圈的ChatGPT就是典型代表。

  針對大模型,昆侖芯持續打磨部署優化方案,領跑產業落地。昆侖芯已將大模型的Transformer相關優化技術沉淀為重要基建,優化后的性能比原有方案提升5倍以上,壓縮顯存30%以上。AI繪畫模型的推理算力及顯存需求隨圖像分辨率增大而指數級增加,同時,圖像生成需要循環采樣數十次,產業落地動輒需要高昂成本的部署集群,嚴重阻礙了AIGC模型大規模商業化落地。

  2022年第四季度,昆侖芯聯合客戶,基于飛槳PaddlePaddle發起了端到端聯合優化項目。在2-3周內,項目組快速完成端到端優化,最終實現輸入文本后2秒出圖的優化效果,性能提升近8倍。

  目前,昆侖芯AI加速卡R200已在該客戶的大模型場景完成規模部署,性能數據全面超越同系列主流推理卡:

  基于昆侖芯AI加速卡R200高效運算與推理能力,綜合優化方案,在dpm-25steps算法下,利用昆侖芯AI加速卡R200,生成1024*1024圖像時的推理速度為10.89 iters/s,相比同能力的主流推理卡快20%。

本文地址:http://m.4huy16.com/thread-816576-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 電動兩輪車設計生態系統
  • Microchip第22屆中國技術精英年會——采訪篇
  • Microchip第22屆中國技術精英年會上海首站開幕
  • 常見深度學習模型介紹及應用培訓教程
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表