スクエア
最新
注目
ニュース
プロフィール
ポスト
Gateアプリをダウンロードするにはスキャンしてください
その他のダウンロードオプション
今日はこれ以上表示しない
AgentIan
2025-08-15 09:58:33
フォロー
ローカル大モデルを一晩中試行錯誤した結果、最終的な選択が決まりました:
1.主要なモデル:Qwen-30B-Instruct、日常的な作業にはこれで十分です。(指示に従うのが非常に良い)
2. 推論の予備:8ビット改造版のGPT OSS mlxを残しました。GPT-OSSの4ビット版はあまり良くなく、推論予算をフルに使っても3段階の意味はあまりありません。
3. coder 全方向、ローカルモデルを考慮せずにSOTAフラッグシップを直接使用するつもりです(結局は仕事ですから)
GPT
1.38%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
0/400
コメント
コメントなし
トピック
#
Gate July Transparency Report
7k 人気度
#
BTC ETFs Top $153B in Holdings
11k 人気度
#
Fed Ends Novel Activities Supervision
10k 人気度
#
Bit Digital’s Pivot Pays Off
5k 人気度
#
ETH Surge Team Battle is Here
2k 人気度
ピン
サイトマップ
ローカル大モデルを一晩中試行錯誤した結果、最終的な選択が決まりました:
1.主要なモデル:Qwen-30B-Instruct、日常的な作業にはこれで十分です。(指示に従うのが非常に良い)
2. 推論の予備:8ビット改造版のGPT OSS mlxを残しました。GPT-OSSの4ビット版はあまり良くなく、推論予算をフルに使っても3段階の意味はあまりありません。
3. coder 全方向、ローカルモデルを考慮せずにSOTAフラッグシップを直接使用するつもりです(結局は仕事ですから)