Giới thiệu

TechTalk 6: RReinforcement Learning, Imitation Learning and Beyond

Reinforcement learning và Imitation learning là hai nền tảng cơ bản nhất khi giải quyết các bài toán quyết định dây chuyền (sequential decision-making). Khó có thể nhắc đến những tiến bộ gần đây về trí tuệ nhân tạo (Atari, AlphaGo, OpenAI Five, AlphaStar) mà không nhắc đến hai nền tảng này. Tuy nhiên đã đưa trí tuệ nhân tạo đi rất xa so với xuất phát điểm, hai nền tảng này vẫn tồn tại những điểm yếu mà nếu không nhận ra và tháo gỡ thì rất khó để đạt những bước tiến xa hơn.

Đến TechTalk các bạn sẽ được giới thiệu một cách nhìn khác về reinforcement/imitation learning mà không được nhắc đến trong các sách giáo khoa, phân tích những điếm yếu của hai nền tảng này và cách giải quyết chúng. Và cũng sẽ được giới thiệu một số công cụ để các bạn có thể học, thực hành và sáng tạo với reinforcement/imitation learning.

Speaker: Nguyễn Xuân Khánh

Hiện đang là nghiên cứu sinh tại trường đại học Maryland, Hoa Kỳ. Nghiên cứu của anh tập trung vào việc tận dụng khả năng đọc hiểu ngôn ngữ tự nhiên (NLP) để giúp trí tuệ nhân tạo tương tác một cách thông minh với con người và môi trường xung quanh. Trước khi làm nghiên cứu sinh, Khánh là cựu sinh viên đại học Massachusetts, và cựu học sinh chuyên Tin trường Phổ Thông Năng Khiếu - đại học quốc gia TPHCM. Ngoài nghiên cứu, Khánh có sở thích chia sẻ kiến thức thông qua các diễn đàn học thuật, hiện đang quản lý trang Machine Learners với gần 4,000 thành viên, và từng quản trị trang VNOI về lập trình thuật toán. Trước khi nghiên cứu Machine Learning, Khánh là một người yêu thích lập trình thuật toán, từng đạt huy chương Đồng Olympic Tin học quốc tế vào năm 2009.

einforcement Learning, Imitation Learning and Beyond

 

 

Thông tin vé

Free

Miễn Phí
Ngừng đăng ký online

Nhà tổ chức

VietAI

Tổ chức phi lợi nhuận Trí tuệ nhân tạo Việt

Liên hệ nhà tổ chức