Lần đầu gặp Larry Page mùa hè năm 1995, Sergey Brin còn là học viên cao học năm hai của khoa Khoa học máy tính tại Đại học Stanford. Brin tình nguyện làm hướng dẫn cho các học viên năm nhất đã nhập học nhưng chưa biết nên học gì. Nhiệm vụ của ông bao gồm dẫn một chuyến thăm quan San Francisco. Page, cựu sinh viên chuyên ngành kỹ thuật Đại học Michigan, có mặt trong nhóm của Brin.
Chuyến đi hôm đó, hai người không ngừng đụng độ, tranh luận về giá trị của các phương pháp tiếp cận khác nhau đối với quy hoạch đô thị. “Sergey là một người khá xã giao; ông ấy thích gặp gỡ mọi người”, Page nhớ lại, đối chiếu phẩm chất đó với sự thận trọng của bản thân. “Tôi nghĩ ông ấy tương đối đáng ghét. Ông ấy có quan điểm thực sự mạnh mẽ về mọi thứ, và tôi đoán tôi cũng vậy”.
“Chúng tôi đều thấy đối phương khá đáng ghét”, Brin nói. “Dù vậy, rõ ràng, chúng tôi dành nhiều thời gian để nói chuyện”.
Khi Page xuất hiện tại Stanford vài tháng sau, ông lựa chọn Terry Winograd – người tiên phong về tương tác máy tính con người – làm cố vấn. Không lâu sau, ông bắt đầu tìm kiếm chủ đề cho luận án Tiến sỹ. Một luận văn có thể định hình toàn bộ sự nghiệp của một người. Ông nảy ra khoảng 10 ý tưởng nhưng hứng thú nhất với World Wide Web.
Larry Page (trái) và Sergey Brin
Bất chấp thực tế các cựu sinh viên Stanford trở nên giàu có nhờ lập công ty Internet, Page phát hiện web chỉ hấp dẫn vì các đặc điểm toán học của nó. Mỗi máy tính là một “nút”, mỗi liên kết trên một trang Web là kết nối giữa các “nút” đó – một cấu trúc đồ thị cổ điển. Page đặt ra giả thuyết World Wide Web có thể là đồ thị lớn nhất từng có và phát triển với tốc độ chóng mặt. Nhiều hiểu biết hữu ích ẩn sâu đang chờ sinh viên khám phá. Ông Winograd đồng tình, Page bắt đầu cân nhắc về cấu trúc liên kết của Web.
Back Rubs và PageRank
Trong quá trình nghiên cứu, Page để ý khi nhìn vào một trang web, bạn không thể biết được chúng đang liên kết với trang nào. Ông cảm thấy phiền vì điều đó vì cho ràng sẽ hữu ích hơn nếu biết được điều này.
Chính vì vậy, ông nghiên cứu về backlink (những liên kết được trả về từ các website, blog, diễn đàn, mạng xã hội khác tới website) và đặt tên cho dự án là BackRub. Vào thời điểm đó, Web gồm khoảng 10 triệu tài liệu với vô số liên kết giữa chúng. Các tài nguyên máy tính cần thiết để thu thập dữ liệu lượng lớn như vậy vượt xa giới hạn thông thường một dự án sinh viên. Page bắt đầu xây dựng trình thu thập thông tin (crawler) của mình.
Sự phức tạp và quy mô của ý tưởng hấp dẫn Brin. Ông nhận thấy tiền đề phía sau BackRub thật sự hấp dẫn. “Tôi đã nói chuyện với nhiều nhóm nghiên cứu trong trường và đây là dự án thú vị nhất vì nó vừa giải quyết vấn đề Web – đại diện cho tri thức con người, vừa vì tôi yêu mến Larry”, Brin hồi tưởng.
Tháng 3/1996, Page trỏ crawler tự phát triển vào một trang web duy nhất – trang chủ của ông tại Stanford – và để nó thu thập thông tin từ đây.
Page đưa ra lý thuyết rằng, cấu trúc của biểu đồ Web sẽ không chỉ tiết lộ ai đang liên kết với ai, mà quan trọng hơn, tầm quan trọng của việc ai đã liên kết với ai, dựa trên các thuộc tính khác nhau của trang Web đang thực hiện liên kết. Lấy cảm hứng từ phân tích trích dẫn, Page nhận ra số lượng liên kết thô đến một trang sẽ là một hướng dẫn hữu ích cho thứ hạng của trang đó. Ông cũng thấy rằng mỗi liên kết cần xếp hạng riêng, dựa trên số lượng liên kết của trang gốc của nó. Tuy nhiên, cách tiếp cận như vậy đặt ra một thách thức toán học đệ quy và hóc búa: bạn không chỉ phải đếm các liên kết của một trang cụ thể mà còn phải đếm các liên kết được gắn vào các liên kết. Phép tính trở nên vô cùng phức tạp.
May mắn là Page có Brin làm cộng sự, người có khả năng thiên phú về toán học. Brin là con trai của một nhà khoa học NASA kiêm Giáo sư toán Đại học Maryland. Gia đình ông chuyển từ Nga sang Mỹ năm ông 6 tuổi. Thời trung học, Brin đã được đánh giá là một thiên tài toán học. Ông đăng ký vào Stanford để phát triển tài năng.
Cùng với nhau, Page và Brin tạo ra hệ thống xếp hạng, thưởng các liên kết đến từ những nguồn quan trọng và phạt các liên kết ngược lại. Chẳng hạn, các trang Web liên kết với IBM.com có thể là của một đối tác trong ngành, hay của một lập trình viên tuổi teen. Theo quan sát của con người, đối tác kinh doanh quan trọng hơn, nhưng làm thế nào để thuật toán hiểu được điều đó?
Đột phá của Page và Brin chính là thuật toán – PageRank – đánh giá cả hai yếu tố: số lượng liên kết dẫn tới một trang cụ thể và số lượng liên kết vào mỗi trang Web liên kết. Quay lại ví dụ ở trên, giả định rằng chỉ có vài trang web liên kết tới trang web của lập trình viên tuổi teen. Ngược lại, hàng ngàn trang web liên kết tới Intel và các trang này trung bình cũng có hàng ngàn trang web liên kết lại. PageRank sẽ xếp trang của lập trình viên tuổi teen không quan trọng bằng của Intel, ít nhất trong mối quan hệ với IBM.
Đó là một cách nhìn đơn giản. Các trang web phổ biến hơn xếp ở vị trí cao hơn và ngược lại.
Khi theo dõi kết quả, Brin và Page nhận ra dữ liệu của họ có thể tác động đến tìm kiếm Internet. Page và Brin cũng thấy rằng kết quả của BackRub ưu việt hơn các công cụ tìm kiếm sẵn có như AltaVista, Excite, thường trả về danh sách không liên quan. “Họ chỉ nhìn vào văn bản mà không cân nhắc tín hiệu khác”, Page nói.
Không chỉ có vậy, công cụ mở rộng quy mô theo quy mô của web. Do PageRank hoạt động bằng cách phân tích các liên kết, web càng lớn, công cụ càng tốt. Thực tế đó là cảm hứng để hai nhà sáng lập đặt tên công cụ là Google – na ná googol, cụm từ chỉ 100 số 0 theo sau số 1. Họ ra mắt phiên bản Google đầu tiên trên website Stanford tháng 8/1996. Để cải tiến dịch vụ, họ cần lượng lớn tài nguyên điện toán nên đã mượn ổ cứng từ phòng thí nghiệm của trường. Phòng ký túc xá của Page biến thành đại bản doanh, trung tâm lập trình, lấp đầy máy móc.
Dự án trở thành một huyền thoại trong Stanford. Có thời điểm, crawler BackRub ngốn gần một nửa băng thông của cả trường. Thậm chí, mùa thu năm 1996, dự án gần như đánh sập kết nối Internet tại đây nhưng may mắn không bị ai phàn nàn quá nhiều.
Thành lập công ty
Trong khi Brin và Page tiếp tục thử nghiệm, BackRub và Google gây tiếng vang trong và ngoài Stanford. Một trong số những người hay tin là Giáo sư Đại học Cornell, Jon Kleinberg, người đang nghiên cứu công nghệ tìm kiếm và sinh trắc học tại trung tâm Almaden của IBM. Phương pháp tiếp cận xếp hạng Web của ông có lẽ nổi tiếng chỉ sau PageRank. Mùa hè năm 1997, ông ghé thăm Page tại Stanford, hai người trao đổi nghiên cứu với nhau. Ông động viên Page xuất bản báo cáo học thuật về PageRank.
Song, Page nói ông lo nếu công khai, ai đó sẽ đánh cắp ý tưởng của mình. Với PageRank, ông có cảm giác mình đang sở hữu một bí thuật. Mặt khác, Page và Brin không chắc họ có muốn khởi nghiệp và điều hành công ty hay không. Trong năm đầu học Stanford của Page, cha ông qua đời, ông hoàn thành luận án Tiến sỹ để tôn vinh cha mình.
Brin nhớ lại khi nói chuyện với cố vấn, ông đã khuyên: “Xem này, nếu Google thành công thì thật tuyệt. Nếu không, em có thể quay lại cao học và hoàn thành luận án”. “Tôi đáp, “Vâng, sao lại không? Em sẽ thử xem sao””.
Và như vậy, bộ đôi thiên tài Brin và Page đã thành lập Google vào ngày 27/9/1998 tại Menlo Park, California.
Nguồn: https://cafef.vn/ga-khong-lo-google-ra-doi-tu-ky-tuc-xa-dai-hoc-20220228090258878.chn