Các nhà nghiên cứu tại Đại học California Sandiego vừa góp phần “giải mã” cách hoạt động của trí tuệ nhân (AI) tạo bằng một công thức toán học đơn giản. Công cụ thống kê chính để tìm ra lời giải này mang tên AGOP Average Gradient Outer Product (Tạm dịch: Tích ngoài Gradient Trung bình). AGOP làm sáng tỏ quá trình mạng neuron như ChatGPT, GPT-2 phân biệt và vận dụng những thuộc tính đặc trưng của dữ liệu để thực hiện dự đoán.
Khi mà AI đang mở rộng phạm vi ảnh hưởng đến nhiều lĩnh vực trong cuộc sống như tài chính, chăm sóc sức khoẻ, và giải quyết vấn đề việc làm, công thức AGOP sẽ mở ra cơ hội biến công nghệ AI trở nên dễ hiểu, dễ tiếp cận và hiệu quả hơn. Nhiệm vụ chính của nhóm là làm rõ tính chất “hộp đen”– ám chỉ cơ chế ra quyết định và kiến trúc phức tạp của mạng neuron.
Hơn cả giải mã về mặt lý thuyết, các nhà nghiên cứu đã áp dụng AGOP vào những kiến trúc máy học không sử dụng mạng neuron giúp tăng cường hiệu suất làm việc của chúng. Điều này chứng tỏ chúng ta có thể phát triển mô hình AI đơn giản và ít tốn kém hơn hiện nay để dễ dàng “dân chủ hoá” trí tuệ nhân tạo.

Mạng neuron học bằng cách tập trung vào những tính chất “có liên quan” của đối tượng. Để xác định một người có đang đeo kính hay không, mạng thần kinh sẽ chú trọng phần trên của gương mặt (mắt và mũi) và phớt lờ những chi tiết khác không liên quan (miệng, tóc, cằm…). Nhờ AGOP, ta đã có thể thể biểu diễn toán học phần nào những điều kiện AI dùng để chọn lọc những chi tiết “có liên quan” ấy.
Nguồn: https://phys.org/…/2024-03-neural-networks-mathematical…
Tổng hợp: Khoa Lê