Mô hình lớn địa phương đã được thử nghiệm suốt một đêm, cuối cùng đã chọn ra.
1.Mô hình chính: Qwen-30B-Instruct, dùng nó để làm việc hàng ngày là đủ. (Tuân thủ hướng dẫn rất tốt)
2. Suy diễn dự phòng: Để lại một phiên bản GPT OSS mlx được điều chỉnh 8-bit. Phiên bản 4-bit của GPT-OSS không được tốt lắm, việc kéo ngân sách suy diễn lên mức tối đa ba mức không có ý nghĩa lớn.
3. coder tất cả các hướng, dự định không xem xét mô hình địa phương mà trực tiếp sử dụng SOTA flagship (dù sao thì cũng cần làm việc)
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mô hình lớn địa phương đã được thử nghiệm suốt một đêm, cuối cùng đã chọn ra.
1.Mô hình chính: Qwen-30B-Instruct, dùng nó để làm việc hàng ngày là đủ. (Tuân thủ hướng dẫn rất tốt)
2. Suy diễn dự phòng: Để lại một phiên bản GPT OSS mlx được điều chỉnh 8-bit. Phiên bản 4-bit của GPT-OSS không được tốt lắm, việc kéo ngân sách suy diễn lên mức tối đa ba mức không có ý nghĩa lớn.
3. coder tất cả các hướng, dự định không xem xét mô hình địa phương mà trực tiếp sử dụng SOTA flagship (dù sao thì cũng cần làm việc)