2025-08-15 09:58:33

Model besar lokal telah direpotkan semalaman, akhirnya pilihan pun keluar:

1.Model utama: Qwen-30B-Instruct, cukup untuk pekerjaan sehari-hari. (Kepatuhan instruksi sangat baik)

2. Inferensi cadangan: Menyimpan versi modifikasi 8-bit dari GPT OSS mlx. Versi 4-bit dari GPT-OSS tidak terlalu baik, dan mengoptimalkan anggaran inferensi hingga tiga level tidak banyak berarti.

3. coder semua arah, berencana untuk tidak mempertimbangkan model lokal dan langsung menggunakan SOTA flagship (bagaimanapun juga bekerja)

GPT17.01%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#July PPI Beats Expectations
37k Popularitas
#ETH ETFs Top $30B
39k Popularitas
#Gate Alpha Peak Trading Competition
149k Popularitas
#Gate Releases August Reserves Report
18k Popularitas
#BTC Hits New ATH
88k Popularitas

Sematkan

peta situs