Học Tăng Cường

Học cách xây dựng các tác tử thông minh có thể đưa ra quyết định tối ưu thông qua phương pháp thử và sai. Khám phá các khái niệm như Q-learning, policy gradients và các ứng dụng của chúng.

3 courses