Kajian
Melatih Semula GPT-2 Menggunakan Maklum Balas Manusia
Dengar Ringkasan
Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.
Digest Audio Harian
Dapatkan ringkasan audio berita AI harian pada peranti anda.
Pasang NadiAI untuk akses pantas kepada 5 berita AI terkini setiap hari.
- Klik Aktifkan Alert dan benarkan notifikasi daripada NadiAI.
- Jika pilihan Pasang App muncul di address bar, anda boleh pasang NadiAI untuk akses lebih pantas.
- Jika tidak, bookmark halaman ini atau pin tab NadiAI.
Ringkasan
OpenAI menala semula GPT-2 (774M parameter) menggunakan maklum balas manusia untuk pelbagai tugas dan berjaya menepati pilihan pelabel luaran walaupun ia kadangkala berbeza dengan pasukan mereka. Untuk ringkasan diperlukan 60,000 label kerana pelabel cenderung memilih ayat yang disalin terus dari input, manakala tugas sambungan teks gaya ringkas memerlukan kira-kira 5,000 label.
Kenapa Ini Penting
Pendekatan ini penting untuk keselamatan dan pemahaman nilai manusia apabila mesin berinteraksi dengan manusia.