• <menuitem id="nuuzd"><optgroup id="nuuzd"></optgroup></menuitem>
    <bdo id="nuuzd"><optgroup id="nuuzd"><dd id="nuuzd"></dd></optgroup></bdo>
  • <bdo id="nuuzd"><optgroup id="nuuzd"></optgroup></bdo>
  • <bdo id="nuuzd"></bdo>
    <bdo id="nuuzd"><optgroup id="nuuzd"></optgroup></bdo>
    1. <bdo id="nuuzd"></bdo>

    2. <menuitem id="nuuzd"><dfn id="nuuzd"></dfn></menuitem>
          手機版 您好,歡迎瀏覽報廢產品銷毀_庫存產品銷毀_過期食品銷毀_護膚品化妝品銷毀_文件銷毀-廣州GDYF益美報廢銷毀公司
      新聞中心
      主頁 > 新聞中心 > 內容
      廣州GDYF報廢銷毀公司:元象XVERSE開源650億參數通用大模型XVERSE-65B
      發布時間:2023-11-06

      廣州益美報廢銷毀公司 11月6日 報導:元象XVERSE宣布 開源650億參數高性能通用大模型XVERSE-65B,無條件免費商用。

      XVERSE-65B 是由深圳元象科技開發的一種支持多語言的大型語言模型。它采用了 Transformer 網絡結構,參數規模達到了650億。

      模型經過訓練了2.6萬億個令牌的高質量多樣化數據,包括了40多種語言。XVERSE-65B 具有16K 的上下文長度,適用于多輪交流、知識問答和摘要等任務。模型已在多個標準數據集上進行了測評,并取得了優越的性能。

      庫存產品銷毀,GDYF,文件銷毀,標書銷毀,護膚品銷毀,檔案銷毀,硬盤銷毀,電子產品物資銷毀,化妝品銷毀,飲料銷毀,過期產品銷毀,海關物品銷毀

      要緊特點如下:

      模型結構:XVERSE-65B 使用主流 Decoder-only 的標準 Transformer 網絡結構,支持16K 的上下文長度(Context Length),能滿足更長的多輪互動、知識問答與摘要等需求,模型應用場景更廣泛。

      訓練數據:構建了2.6萬億 token 的又好又快、多樣化的數據對模型進行充分訓練,網羅中、英、俄、西等40多種語言,經過精細化設置不同類型數據的采樣比例,使得中英兩種語言顯現無良,也能兼顧其他語言效果。

      分詞:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 語料訓練了一個詞表大小為100,534的分詞器,大概同時支持多語言,而無需額外添加詞表。

      訓練框架:自主創意多項重要技術,囊括高效算子、顯存優化、并行調度策略、數據-計算-通信重疊、平臺和框架共同等,讓訓練用意更高,模型穩定性強,在千卡集群上的峰值算力利用率位居業界前列。

      項目地址:https://github.com/xverse-ai/XVERSE-65B

      (舉報)

      午夜一级福利片