Nội dung bài viết:
Cách hoạt động của thuật toán Tìm kiếm
Để đưa website lên TOP, bên dưới là cách mà google thực hiện phân tích đánh giá và đưa ra kết quả, bạn hãy đọc để hiểu nhé.
1. Phân tích các từ của bạn
Việc hiểu được nghĩa của tìm kiếm của bạn là điều quan trọng để trả về câu trả lời thích hợp. Vì thế để tìm các trang có thông tin liên quan, bước đầu tiên của chúng tôi là phân tích các từ trong truy vấn của bạn có nghĩa gì. Chúng tôi xây dựng các mô hình ngôn ngữ để cố giải mã những chuỗi từ chúng tôi nên tra trong chỉ mục.
Điều này bao gồm các bước trông có vẻ đơn giản như phân tích các lỗi chính tả, và mở rộng đến cả việc cố gắng hiểu loại truy vấn bạn đã nhập bằng cách áp dụng một số nghiên cứu mới nhất về hiểu ngôn ngữ tự nhiên. Ví dụ: hệ thống từ đồng nghĩa của chúng tôi giúp Tìm kiếm biết được bạn có ý gì, ngay cả khi một từ có nhiều định nghĩa. Hệ thống này mất 5 năm để phát triển và đã cải thiện đáng kể kết quả trong hơn 30% lượt tìm kiếm bằng các ngôn ngữ khác nhau.
Chúng tôi cũng cố hiểu bạn đang tìm kiếm loại thông tin nào. Đó là một tìm kiếm rất cụ thể hay một truy vấn rộng? Có những từ như “đánh giá”, “ảnh” hay “giờ mở cửa” cho biết bạn cần thông tin cụ thể từ tìm kiếm hay không? Bạn có đang tìm kiếm các từ khóa thịnh hành cho thấy rằng bạn muốn nội dung được xuất bản vào ngày đó hay không? Hay bạn đang tìm kiếm một doanh nghiệp lân cận và muốn thông tin về địa phương?
Một khía cạnh đặc biệt quan trọng của việc phân loại cụm từ tìm kiếm này đó là chúng tôi sẽ phân tích xem bạn có đang tìm kiếm nội dung mới hay không. Nếu bạn đang tìm kiếm bằng những từ khóa thịnh hành, thì thuật toán về độ cập nhật của chúng tôi sẽ diễn giải cụm từ tìm kiếm của bạn như một tín hiệu cho biết các thông tin mới có thể sẽ có ích hơn những trang thông tin cũ. Điều này có nghĩa là khi bạn đang tìm kiếm “tỉ số giải NFL”, kết quả chương trình “khiêu vũ cùng ngôi sao” hay “lợi nhuận của exxon” gần đây nhất, thì bạn sẽ thấy thông tin mới nhất.
2. Đối sánh tìm kiếm của bạn
Tiếp theo, chúng tôi tìm các trang web có thông tin khớp với truy vấn của bạn. Khi bạn tìm kiếm, ở mức độ cơ bản nhất, các thuật toán của chúng tôi sẽ tra cụm từ tìm kiếm của bạn trong chỉ mục để tìm các trang thích hợp. Các thuật toán này phân tích tần suất và vị trí các từ khóa đó xuất hiện trên một trang, liệu chúng xuất hiện trong tựa đề, tiêu đề hay nội dung.
Tín hiệu cơ bản nhất cho thấy thông tin có liên quan là khi một trang web chứa những từ khóa tương tự với cụm từ tìm kiếm của bạn. Nếu những từ khóa đó xuất hiện trên trang, hoặc nếu những từ đó xuất hiện ở tiêu đề hoặc nội dung văn bản, thông tin đó có nhiều khả năng có liên quan. Ngoài việc đối sánh từ khóa đơn giản, chúng tôi sử dụng dữ liệu tương tác tổng hợp và ẩn danh để đánh giá xem các kết quả tìm kiếm có liên quan tới cụm từ tìm kiếm hay không. Chúng tôi biến đổi dữ liệu đó thành các tín hiệu giúp hệ thống máy học của chúng tôi ước tính mức độ liên quan tốt hơn.
Cũng như việc đối sánh từ khóa, các thuật toán tìm các gợi ý để đo mức độ phù hợp giữa kết quả tìm kiếm tiềm năng và nội dung người dùng đang tìm kiếm. Khi bạn tìm “chó”, có thể bạn không muốn một trang có từ “chó” xuất hiện hàng trăm lần. Chúng tôi cố tìm hiểu xem liệu trang có cung cấp câu trả lời cho truy vấn của bạn không và không chỉ lặp lại truy vấn hay không. Vì thế các thuật toán Tìm kiếm phân tích liệu trang có nội dung thích hợp hay không — chẳng hạn như ảnh, video về chó hay thậm chí danh sách các giống chó. Cuối cùng, chúng tôi kiểm tra xem trang có được viết bằng ngôn ngữ giống như câu hỏi của bạn hay không để ưu tiên các trang bằng ngôn ngữ tùy chọn của bạn.
Cần lưu ý rằng trong khi hệ thống của chúng tôi tìm kiếm những loại tín hiệu có thể định lượng để đánh giá mức độ liên quan, hệ thống không được thiết kế để phân tích những khái niệm chủ quan như quan điểm hoặc thiên hướng chính trị thể hiện trong nội dung của trang.
3. Xếp hạng các trang hữu ích
Đối với một truy vấn thông thường, có hàng nghìn, thậm chí là hàng triệu trang web có thể cung cấp thông tin liên quan. Vì thế, để giúp xếp hạng các trang tốt nhất đầu tiên, chúng tôi cũng viết các thuật toán để đánh giá mức độ hữu ích của các trang web này.
Các thuật toán này phân tích hàng trăm yếu tố khác nhau để cố hiển thị thông tin tốt nhất có sẵn trên web, từ độ mới mẻ của nội dung cho đến số lần xuất hiện của cụm từ tìm kiếm của bạn và liệu trang có cung cấp trải nghiệm người dùng tốt hay không. Để đánh giá độ đáng tin cậy và nguồn có căn cứ về chủ đề, chúng tôi tìm các trang web có vẻ được nhiều người dùng đánh giá cao đối với cùng truy vấn. Nếu các trang web nổi bật khác về chủ đề này có liên kết đến trang, đó là một dấu hiệu tốt cho thấy thông tin có chất lượng cao.
Có nhiều trang web spam trên web cố tìm cách vươn lên đầu kết quả tìm kiếm bằng các kỹ thuật như lặp lại từ khóa hay mua các liên kết vượt qua được PageRank. Các trang web này cung cấp trải nghiệm người dùng rất kém và thậm chí có thể gây hại hay nhầm lẫn cho người dùng của Google. Vì thế, chúng tôi viết các thuật toán để xác định spam và xóa các trang web vi phạm nguyên tắc quản trị trang web của Google khỏi kết quả của chúng tôi.
Nội dung trên web và hệ sinh thái thông tin rộng lớn luôn thay đổi. Do đó, chúng tôi liên tục đo lường và đánh giá chất lượng của các hệ thống của chúng tôi để đảm bảo sự cân bằng giữa mức độ phù hợp với tính xác thực của thông tin để tăng độ tin cậy của kết quả mà bạn nhìn thấy.
4. Đưa ra câu trả lời hữu ích có nhiều hình thức
Larry Page từng mô tả công cụ tìm kiếm hoàn hảo là một công cụ hiểu chính xác ý định của bạn và cung cấp cho bạn đúng điều bạn muốn. Theo thời gian, quy trình thử nghiệm của chúng tôi đã luôn cho thấy rằng mọi người muốn có câu trả lời nhanh cho yêu cầu tìm kiếm của họ. Chúng tôi đã cải thiện rất nhiều trong việc cung cấp cho bạn câu trả lời phù hợp nhất, nhanh nhất và bằng các định dạng hữu ích nhất cho loại thông tin bạn đang tìm kiếm.
Nếu đang tìm thông tin thời tiết, chắc bạn sẽ muốn dự báo thời tiết trên trang kết quả chứ không chỉ liên kết đến các trang thời tiết. Hoặc chỉ đường: nếu truy vấn của bạn là “Chỉ đường đến sân bay San Francisco”, bạn sẽ muốn bản đồ kèm theo chỉ đường chứ không chỉ liên kết đến các trang web khác. Điều này đặc biệt quan trọng trên các thiết bị di động có băng thông giới hạn và thao tác nhấp để chuyển trang rất chậm.
Hàng nghìn kỹ sư và nhà khoa học đang nỗ lực để tinh chỉnh các thuật toán của chúng tôi và phát triển các cách tìm kiếm hữu ích mới. Bạn có thể xem một số điểm cải tiến trong Tìm kiếm của chúng tôi ở bên dưới. Trong số khoảng 3234 điểm cải tiến đối với Google Tìm kiếm chỉ trong năm 2018, đây chỉ là một số cách mà chúng tôi cải thiện Tìm kiếm theo thời gian.
Sơ đồ tri thức
Hướng và lưu lượng
Kết quả trực tiếp
Đoạn trích nổi bật
Danh sách chi tiết
Tìm hiểu những nội dung bạn quan tâm bằng tính năng Khám phá
Phát triển để đáp ứng môi trường web luôn thay đổi
Web liên tục phát triển, với hàng trăm trang web mới xuất bản mỗi giây. Điều đó được phản ánh trong kết quả mà bạn thấy trong Google Tìm kiếm: chúng tôi liên tục thu thập lại dữ liệu web để lập chỉ mục nội dung mới. Tùy thuộc vào truy vấn của bạn, một số trang kết quả sẽ thay đổi nhanh chóng, trong khi các trang khác ổn định hơn. Ví dụ: khi bạn đang tìm kiếm tỷ số mới nhất của một trận đấu thể thao, chúng tôi phải thực hiện cập nhật theo từng giây, trong khi đó kết quả về một nhân vật lịch sử có thể giữ nguyên trong vài năm liên tục.
Hiện nay, Google xử lý hàng nghìn tỷ tìm kiếm mỗi năm. Mỗi ngày, 15% truy vấn chúng tôi xử lý là những truy vấn chúng tôi chưa từng gặp trước đây. Việc xây dựng các thuật toán Tìm kiếm mà có thể mang lại kết quả hữu ích nhất cho tất cả các truy vấn này là một thử thách phức tạp, đòi hỏi đầu tư và kiểm tra chất lượng liên tục.