Bạn có nghĩ đến điều gì tốt đẹp khi nghe đến từ bot không hay bạn biết cách phát hiện và chặn bot xấu? Tôi đoán là tất cả những gì bạn nghe được chỉ là về bot xấu chứ chưa nói đến cách phát hiện và chặn chúng. Tuy nhiên, không phải tất cả bot đều xấu, và vẫn có những bot tốt. Bài viết này
Bạn có nghĩ ra điều gì tốt đẹp khi nghe đến từ bot không hay bạn có biết cách phát hiện và chặn bot xấu không? Tôi đoán là tất cả những gì bạn nghe được chỉ là về bot xấu chứ chưa nói đến cách phát hiện và chặn chúng.
Tuy nhiên, không phải tất cả các bot đều xấu, và cũng có những bot tốt. Bài viết này nói về các bot xấu, cách bạn có thể phân biệt bot tốt với bot xấu và tác hại mà chúng có thể gây ra cho trang web của bạn. Cuối cùng nhưng không kém phần quan trọng, bạn sẽ khám phá ra cách bạn có thể ngăn ngừa hậu quả của bot xấu.
Trước tiên, chúng ta hãy cùng tìm hiểu bot là gì theo thuật ngữ của những người không chuyên.
Theo báo cáo gần đây của một công ty an ninh mạng tại Barracuda , hai phần ba lưu lượng truy cập internet (64%) là bot. Trong số hai phần ba bot này, 40% lưu lượng truy cập internet là bot xấu. Các số liệu thống kê này tính đến tháng 9 năm 2021.
Ngoài ra, báo cáo này chỉ ra rằng nếu chúng ta không thực thi các biện pháp bảo mật nghiêm ngặt, các bot này sẽ vượt qua hàng phòng thủ và đánh cắp dữ liệu, gây ra hiệu suất trang web kém và vi phạm dữ liệu.
Hãy cùng xem xét một số nhiệm vụ hàng ngày mà bot thực hiện.
Một ví dụ thường ngày về hoạt động của bot là các công cụ tìm kiếm như Google sử dụng bot để thu thập thông tin đến hàng nghìn trang web để trích xuất nội dung web để lập chỉ mục cho chúng. Sau đó, khi bạn tìm kiếm một cụm từ trong Google, nó sẽ biết thông tin mong muốn có sẵn ở đâu.
Tương tự như vậy, bot giao dịch sẽ hoàn tất các giao dịch thay cho con người và bot bán vé sẽ mua vé cho các sự kiện phổ biến.
Ngoài ra, kể từ khi AI (Trí tuệ nhân tạo) và Học máy phát triển, các dịch vụ thông minh kinh doanh đã sử dụng bot để thu thập các trang sản phẩm và lời chứng thực từ các hồ sơ mạng xã hội để khám phá hiệu suất của sản phẩm.
Một lý do quan trọng khiến bot được ưa chuộng hơn con người trong một số nhiệm vụ trên là vì chúng có thể thực hiện các lệnh nhanh hơn con người hàng trăm hoặc hàng nghìn lần.
Bây giờ chúng ta hãy tìm hiểu sự khác biệt giữa bot tốt và bot bình thường.
Bạn có thể phân loại bot thành bot tốt và bot xấu, như tôi đã đề cập trước đó. Cũng như mọi thứ khác, trước tiên chúng ta hãy xem xét bot tốt.
Chúng ta vừa xem một ví dụ về một bot tốt, một bot công cụ tìm kiếm. Tương tự như vậy, có những bot tốt khác như:
Như bạn có thể thấy, một trong những đặc điểm riêng biệt của những bot tốt này là chúng thực hiện một nhiệm vụ có giá trị cho một công ty hoặc khách truy cập trang web. Các nhà phát triển xây dựng chúng không làm như vậy với mục đích xấu.
Ngoài ra, chúng không cản trở trải nghiệm của người dùng trên trang web mà chúng thu thập dữ liệu. Một bot tốt cũng tôn trọng các quy tắc trên tệp robot.txt của trang web, trong đó chỉ định các trang được thu thập dữ liệu và không được thu thập dữ liệu.
Tuy nhiên, mặt trái là khi bot truy cập một trang web, chúng có thể tiêu tốn thời gian tải của máy chủ và băng thông. Vì vậy, ngay cả bot thực sự cũng có thể vô tình gây ra thiệt hại. Hơn nữa, một bot công cụ tìm kiếm hung hăng cũng có thể đánh sập một trang web.
Tuy nhiên, bạn có thể khắc phục những hậu quả tiêu cực này bằng cách cấu hình máy chủ phù hợp.
Bây giờ chúng ta hãy tìm hiểu xem bot xấu là gì.
Giống như các bot tốt mang lại giá trị cho người dùng, các nhà phát triển phần mềm phát triển các bot xấu để gây hại. Một số bot xấu trên thị trường là:
Các nhà phát triển phát triển các bot này để gửi lưu lượng truy cập giả đến các trang web nhằm tăng số lượt xem trang để lừa chủ sở hữu trang tin rằng tổng số trang của họ đã tăng. Tuy nhiên, trên thực tế, không có người dùng thực sự nào và chính các bot đang tăng lượt xem trang hoặc lượt thích.
Một số dịch vụ web sử dụng các bot này để bán lưu lượng truy cập. Họ sẽ tuyên bố rằng họ sẽ gửi người dùng thực sự đến trang web của bạn và trên thực tế, họ sẽ gửi lưu lượng truy cập bot.
Một số bot xem video và cũng tăng số lượt xem video đó.
Các bot spam thường truy cập một trang web để thực hiện các tác vụ spam. Một trong những ví dụ quan trọng về hoạt động spam là chúng tự động tương tác với các biểu mẫu trực tuyến, để lại bình luận và gửi chúng bằng cách tự động nhấp vào nút gửi.
Ví dụ, một số đối thủ cạnh tranh của doanh nghiệp bạn để lại bình luận giả mạo về sản phẩm để tạo ra các đánh giá tiêu cực về sản phẩm. Một ví dụ khác về việc sử dụng bot spam thường xuyên là trong các chiến dịch chính trị.
Bạn có thể thường nhận thấy rằng các bình luận spam thậm chí còn chứa URL và các ký tự đặc biệt.
Web scraper là các bot internet giúp đánh cắp nội dung của bạn. Các bot scraper này thường truy cập các trang web và trích xuất dữ liệu mà không có sự đồng ý của quản trị viên trang web.
Mặc dù việc thu thập dữ liệu trực tuyến không phải là bất hợp pháp theo luật định, miễn là nội dung được công khai, không cần bất kỳ xác thực nào và không phải tuân theo luật bản quyền, thì tác giả thường không thích điều này. Những người thu thập dữ liệu trực tuyến có thể đóng trang web nếu họ gửi quá nhiều truy vấn.
Mọi người thường sử dụng bot thanh toán khi mua giày thể thao phiên bản giới hạn để mua giày thể thao. Vì người dùng chỉ được phép mua một đôi duy nhất do tính cạnh tranh của phiên bản giới hạn, họ sử dụng bot thanh toán để đẩy nhanh quá trình thanh toán trực tuyến.
Quá trình mua giày thể thao này của bot diễn ra với tốc độ cao hơn cả tốc độ mà chỉ con người mới có thể mơ tới. Do đó, những người mua thực sự sẽ không có cơ hội mua được bất kỳ đôi giày thể thao nào vì họ không thể đạt được tốc độ của bot. Bạn có thể thấy đây là một bài đọc thú vị: Bot giày thể thao là gì và chúng được sử dụng như thế nào?
Botnet là mạng máy tính bị tin tặc chiếm quyền điều khiển để thực hiện nhiều cuộc tấn công mạng khác nhau.
Tin tặc phát triển Botnet để tăng khả năng thực hiện các cuộc tấn công phi thường hơn, chẳng hạn như các cuộc tấn công DDOS được phối hợp bằng cách phát triển, tự động hóa và tăng tốc quá trình. Sau đó, botnet sử dụng thiết bị của bạn để lừa đảo và làm phiền thiết bị của người khác mà không có sự hiểu biết hoặc chấp thuận của bạn.
Sau đó, các thiết bị bị nhiễm này được gọi là thiết bị Zoombie. Để biết thêm thông tin về botnet, bạn có thể tham khảo bài viết này .
Những bot này thường đánh cắp thông tin đăng nhập bằng cách sử dụng hai phương pháp tự động phổ biến nhất được gọi là Credential Stuffing và Credential Cracking. Phương pháp trước sử dụng các nỗ lực đăng nhập hàng loạt để xác minh tính hợp lệ của cặp tên người dùng và mật khẩu mà chúng đã đánh cắp.
Ngược lại, phương pháp sau bao gồm bot thử các giá trị khác nhau cho cặp tên người dùng và mật khẩu. Sau đó, bot cuối cùng thành công và đột nhập vào hệ thống máy tính có thể gây ra hậu quả sâu rộng.
Như bạn có thể đoán đúng, gian lận thẻ tín dụng có thể xảy ra trên bất kỳ trang web nào sử dụng bộ xử lý thanh toán. Tin tặc sử dụng bot độc hại để xác minh số thẻ tín dụng mà chúng đánh cắp bằng cách thực hiện các khoản thanh toán nhỏ được gọi là Carding.
Chúng cũng sử dụng công nghệ bẻ khóa thẻ để xác định thông tin còn thiếu như ngày hết hạn và số CVV.
Những mối đe dọa này thường xảy ra với các ngành bán lẻ, giải trí và du lịch.
Phát hiện và quản lý bot đòi hỏi rất nhiều điều tra và chuyên môn vì tin tặc thiết kế bot để chúng vô hình. Bạn cần đào sâu để tìm hiểu xem trang web của bạn có lưu lượng truy cập bot nào không. Mặt khác, bạn cần phải có ít nhất các kết quả dương tính giả (con người bị nhầm là bot) và các kết quả âm tính giả (khi bạn nhầm lẫn con người với bot xấu).
Dù sao đi nữa, sau đây là một số dấu hiệu cho thấy bot có thể đã xâm nhập vào hệ thống của bạn:
Bất kỳ chủ sở hữu trang web nào cũng có thể truy cập vào dữ liệu số liệu trang web. Ví dụ, dữ liệu Google Analytics. Vì vậy, khi bạn xem các số liệu đó, nếu bạn nhận ra rằng có sự gia tăng đáng kể lưu lượng truy cập từ các vị trí bất thường, điều đó cho thấy bot đang tương tác với trang web của bạn.
Trong những trường hợp như vậy, bạn có thể nhận thấy tỷ lệ thoát tăng cao hơn. Các vị trí mà bạn nhận được lưu lượng truy cập này có thể bắt nguồn từ những nơi mà bạn thường không có khách truy cập.
Trong hầu hết các trường hợp, một số bot ít tinh vi hơn không gửi tất cả các tiêu đề mà trình duyệt thường gửi. Trên thực tế, chúng quên gửi tiêu đề tác nhân người dùng .
Các bot tinh vi thường gửi tiêu đề không gửi nhiều hơn chuỗi tác nhân người dùng. Vì vậy, nếu bạn nhận được yêu cầu có ít hoặc không có tiêu đề, điều đó cho thấy các bot có khả năng đang đánh giá trang web của bạn. Ngược lại, các trình duyệt gửi một số lượng thông tin tiêu đề hợp lý.
Như bạn đã biết ở trên, khi bot truy cập vào trang web của bạn, chúng sẽ tiêu tốn hầu hết tài nguyên của trang web, bao gồm cả băng thông. Vì vậy, nếu bạn nhận được hàng loạt yêu cầu từ bot trong một khoảng thời gian ngắn, điều đó có nghĩa là trang web của bạn sẽ chậm hơn đáng kể.
Tuy nhiên, một số bot xảo quyệt hoạt động theo cách mà chúng không bị phát hiện và thực hiện các hoạt động của chúng giống như con người. Chúng sẽ gửi quá ít yêu cầu như con người sẽ làm trong quá trình này.
Vì vậy, bạn không thể luôn dựa vào sự chậm lại về hiệu suất làm thước đo để đo lưu lượng truy cập của bot.
Thông thường, thời lượng phiên hoặc lượng thời gian người dùng dành cho một trang web là ổn định. Tuy nhiên, sự gia tăng đột ngột trong quá trình phiên sẽ ngụ ý rằng bot đang duyệt trang web của bạn ở tốc độ thấp hơn. Mặt khác, bot có thể nhấp qua các trang trên trang web nhanh hơn người dùng, dẫn đến thời gian phiên tự động giảm.
Bạn có thể gặp phải biểu mẫu được gửi từ địa chỉ email lạ, số điện thoại và tên giả.
Những cách khác mà bạn có thể dễ dàng phát hiện bot là nội dung mà chúng có thể đăng. Không giống như con người, bot không có thời gian để tạo ra nội dung chất lượng. Vì vậy, khi bạn bắt đầu nhận được các bình luận hoặc bài đăng mơ hồ, ngớ ngẩn có URL nhúng, bạn cần nhận ra rằng chúng không phải từ người thật mà là bot.
Bước đầu tiên để chống lại các bot xấu này là bạn phải thiết lập tệp robot.txt của trang web. Bạn chắc chắn có thể định cấu hình tệp này để kiểm soát các trang mà bot có thể truy cập và giảm thiểu tương tác của bot với hầu hết các trang trên trang web của bạn.
Một số biện pháp khác bao gồm:
Thiết lập giới hạn tốc độ dựa trên địa chỉ IP – Địa chỉ IP là mã định danh duy nhất của thiết bị đánh giá trang web của bạn. Vì vậy, với tư cách là quản trị viên web, bạn có thể giới hạn số lượng yêu cầu mà một địa chỉ IP thực hiện đối với trang web của bạn trong một khoảng thời gian nhất định.
Chặn các địa chỉ IP đáng ngờ – Bên cạnh việc thiết lập giới hạn tốc độ, địa chỉ web của bạn có thể chặn danh sách các địa chỉ IP đáng ngờ mà các yêu cầu bắt nguồn. Bạn có thể sử dụng WAF (Tường lửa ứng dụng web) cho mục đích này.
Sử dụng dịch vụ Captcha – Bạn có thể đã gặp phải captcha khi truy cập một số trang web. Khi dịch vụ captcha phát hiện hành vi lạ hoặc giống bot, nó sẽ yêu cầu bạn giải quyết vấn đề trước khi nó cho phép truy cập trang web.
Chúng tôi hy vọng bạn đã có được cái nhìn tổng quan toàn diện về bot xấu, cách phát hiện chúng và cuối cùng là loại bỏ chúng. Thật vậy, bạn sẽ cần một số bot thực sự không gây hại cho hệ thống của bạn. Tuy nhiên, sẽ hữu ích nếu bạn loại bỏ các bot xấu bằng mọi giá vì thiệt hại mà chúng có thể gây ra rất nghiêm trọng.
Chúng tôi hy vọng bạn thấy bài viết này hữu ích và hãy theo dõi để biết thêm nhiều bài viết khác.