Kategori

Kajian

VentureBeat AI 08 Jan 2026

NousCoder-14B: Model kod sumber terbuka bersaing dengan Claude Code

Nous Research melancarkan NousCoder-14B, model penjana kod sumber terbuka yang dilatih dalam empat hari menggunakan 48 GPU Nvidia B200 dan mencapai 67.87% pada LiveCodeBench v6. Syarikat itu turut menerbitkan berat model, rangkaian latihan Atropos dan alat pengesahan, serta memberi amaran bahawa set data verifikasi kompetitif (≈24,000 soalan) mungkin hampir mencapai had kualiti tersedia.

OpenAI News 18 Dec 2025

OpenAI nilai kebolehpantauan rantai pemikiran model

OpenAI memperkenalkan rangka kerja dan suite penilaian baharu bagi kebolehpantauan chain-of-thought, merangkumi 13 penilaian dalam 24 persekitaran. Hasil awal OpenAI menunjukkan pemantauan proses dalaman model jauh lebih berkesan daripada pemantauan keluaran semata-mata, membuka laluan untuk kawalan yang boleh diskalakan.

OpenAI News 18 Dec 2025

OpenAI perkuat kerjasama dengan Jabatan Tenaga AS

OpenAI dan U.S. Department of Energy menandatangani memorandum persefahaman untuk memperdalam kerjasama dalam AI dan pengkomputeran maju bagi menyokong penemuan saintifik. Perjanjian itu membina atas kerja dengan makmal kebangsaan dan mencipta rangka bagi penggunaan AI dalam penyelidikan berimpak tinggi di seluruh ekosistem DOE.

OpenAI News 11 Dec 2025

OpenAI GPT-5.2 memajukan penyelidikan matematik dan sains

Menurut OpenAI, GPT-5.2 adalah model terkuat setakat ini untuk matematik dan sains dan mencapai keputusan terbaharu pada penanda aras seperti GPQA Diamond dan FrontierMath. OpenAI menyatakan peningkatan ini membantu kemajuan penyelidikan, termasuk menyelesaikan masalah teoretikal terbuka dan menjana bukti matematik yang lebih boleh dipercayai.

OpenAI News 11 Dec 2025

Kemaskini Sistem GPT‑5: Pengenalan GPT‑5.2

GPT‑5.2 ialah keluarga model terkini dalam siri GPT‑5 dan menggunakan pendekatan mitigasi keselamatan yang serupa dengan kad sistem GPT‑5 dan GPT‑5.1. Model ini dilatih pada set data pelbagai termasuk maklumat awam di internet, data daripada rakan kongsi pihak ketiga, dan input daripada pengguna serta jurulatih manusia.