Mô hình lớn địa phương đã được thử nghiệm suốt một đêm, cuối cùng đã chọn ra.
1.Mô hình chính: Qwen-30B-Instruct, dùng nó để làm việc hàng ngày là đủ. (Tuân thủ hướng dẫn rất tốt)
2. Suy diễn dự phòng: Để lại một phiên bản GPT OSS mlx được điều chỉnh 8-bit. Phiên bản 4-bit của GPT-OSS không được tốt lắm, việc kéo ngân sách suy diễn lên mức tối đa ba mức không có ý nghĩa lớn.
3. coder tất cả các hướng, dự định không xem xét mô hình địa phương mà trực tiếp sử dụng SOTA flagship (dù sao thì cũng cần làm việc)
1.Mô hình chính: Qwen-30B-Instruct, dùng nó để làm việc hàng ngày là đủ. (Tuân thủ hướng dẫn rất tốt)
2. Suy diễn dự phòng: Để lại một phiên bản GPT OSS mlx được điều chỉnh 8-bit. Phiên bản 4-bit của GPT-OSS không được tốt lắm, việc kéo ngân sách suy diễn lên mức tối đa ba mức không có ý nghĩa lớn.
3. coder tất cả các hướng, dự định không xem xét mô hình địa phương mà trực tiếp sử dụng SOTA flagship (dù sao thì cũng cần làm việc)
GPT11.28%