Andreas Groll và các đồng sự đến từ Đại học Dortmund, Đức vừa đưa ra dự đoán thú vị về đội chiến thắng tại Vòng chung kết World Cup 2018 sắp diễn ra.

Bằng phương pháp thống kê gọi là Random Forest (chọn cây quyết định ngẫu nhiên) kết hợp cùng thuật toán machine learning, Groll đã thuyết phục mọi người rằng Tây Ban Nha hoặc Đức sẽ là 2 đội có nhiều khả năng đoạt cúp nhất.

Cách thức truyền thống mà các hãng cá cược lớn trên thế giới đang sử dụng là nhờ tới các chuyên gia thống kê để phân tích từng cơ hội nhỏ nhất của từng trận đấu tiềm năng, từ đó vẽ ra khả năng chiến thắng của mỗi đội tuyển.

Nhưng Groll còn làm được nhiều hơn thế. Random Forest là một giải pháp có thể phân tích một nguồn dữ liệu cực lớn đồng thời vẫn tránh được các lỗi thường gặp của những phương pháp đào xới dữ liệu thông thường. Nó dựa trên ý tưởng rằng một số sự kiện trong tương lai có thể bị chi phối bằng một cây quyết định, trong đó mỗi nhánh rẽ hướng lại cho ra một kết quả khác nhau dựa trên một tập dữ liệu đầu vào.

Theo đó, Groll đã cung cấp cho máy tính nhiều yếu tố đa dạng để tính toán, bao gồm các chỉ số kinh tế, GDP, dân số, thứ hạng của đội tuyển quốc gia trong bảng xếp hạng FIFA, và thông tin cụ thể của mỗi đội như độ tuổi trung bình, số cầu thủ góp mặt ở Champion League, ưu thế đội nhà v.v.

Sau khi giả lập toàn bộ giải đấu trong 100.000 lần, kết quả là Đức sẽ có nhiều cơ hội vô địch nhất, sau đó là Tây Ban Nha.

Tất nhiên, vì số lượng hoán vị của giải đấu này là rất lớn nên mô phỏng này vẫn rất khó xảy ra. Do đó Groll và đồng sự đã đưa ra tỷ lệ cược vào khoảng 1 trong 100.000.

Nói ngắn gọn thì lúc bắt đầu giải đấu, Tây Ban Nha sẽ có nhiều cơ hội đi tiếp, nhưng nếu Đức lọt vào được tứ kết, họ mới là đội chiếm ưu thế hơn.

Năm nay, chúng ta sẽ không có “thánh Paul” nào cả, nhưng biết đâu chúng ta có thể tin vào “thánh Groll” lần này? Hãy cùng chờ xem.

Theo Technology Review

BÌNH LUẬN

Please enter your comment!
Please enter your name here