Cách tạo trình kiểm tra proxy bằng Python

Làm thế nào để, Proxies, Python, Mar-06-20245 phút đọc

Proxy là những công cụ đơn giản bạn có thể sử dụng để biên dịch dữ liệu của mình từ web và thúc đẩy doanh nghiệp của bạn mà không sợ bị chặn hoặc bị cấm. Proxy là trung gian giữa máy tính của bạn và trang web bạn truy cập. Một trang web có thể nhận dạng bạn bằng địa chỉ Giao thức Internet (IP) của bạn khi bạn không sử dụng proxy

Proxy là những công cụ đơn giản bạn có thể sử dụng để biên dịch dữ liệu của mình từ web và thúc đẩy doanh nghiệp của bạn mà không sợ bị chặn hoặc bị cấm. Proxy là trung gian giữa máy tính của bạn và trang web bạn truy cập. Một trang web có thể nhận dạng bạn bằng địa chỉ Giao thức Internet (IP) của bạn khi bạn không sử dụng máy chủ proxy. Sử dụng proxy sẽ thêm một lớp bổ sung giữa máy tính của bạn và trang web. Đầu tiên, bạn kết nối với máy chủ proxy ẩn địa chỉ IP của bạn và hiển thị một địa chỉ khác trên trang web. 

Một số trường hợp sử dụng rộng rãi của proxy là:

  • An ninh
  • Sự riêng tư
  • Tốc độ
  • Định vị địa lý
  • Tổng hợp dữ liệu

Một số proxy không hoạt động do một số hạn chế. Khi bạn cố gắng kết nối với Internet, bạn nhận được thông báo hết thời gian chờ. Đó là bởi vì các proxy quá chậm hoặc không tồn tại. Ở đây cần phải có một trình kiểm tra proxy. Bạn có thể tiết kiệm thời gian bằng cách sử dụng trình kiểm tra proxy để kiểm tra proxy của mình. Nó giúp bạn quét hàng loạt proxy. Khi bạn sử dụng proxy miễn phí, bạn nên biết chúng tắt mà không cần lựa chọn trong giây lát. Do đó, bạn phải giữ trình kiểm tra proxy của mình tiện dụng. Bạn sẽ phải sử dụng nó hàng ngày để kiểm tra xem proxy nào đang hoạt động. 

Mục lục

Mẹo sử dụng trình kiểm tra proxy

Dưới đây là một số mẹo bạn cần làm theo để sử dụng trình kiểm tra proxy. 

  • Kiểm tra vị trí - Điều cần thiết là phải kiểm tra vị trí vì nếu bạn đi với proxy từ một nơi được biết đến với các cuộc tấn công mạng, bạn sẽ gặp khó khăn khi truy cập nội dung mong muốn. Bạn có thể bị cấm và phải chuyển sang proxy tiếp theo trong danh sách của mình. 
  • Kiểm tra tốc độ - Hầu hết mọi người sử dụng trình kiểm tra proxy để tìm các proxy đang hoạt động. Nó là điều cần thiết, nhưng bạn cũng cần phải xem xét tốc độ của trình kiểm tra proxy. Một số proxy hoạt động tốt nhưng cực kỳ chậm. Vì vậy, bạn phải dành phần lớn thời gian trực tuyến để chờ kết nối. 

Cách tạo trình kiểm tra proxy bằng Python

Hãy xem cách chúng ta có thể tạo trình kiểm tra proxy bằng Python với sự trợ giúp của các bước dưới đây.

Nhập thư viện

Bạn cần nhập hai thư viện sau, tức là

  • urllib.request
  • Socket
Nhập urllib.request, socket
socket.setdefaulttimeout(180)

Ở đây, mô-đun urllib.request xác định các lớp và các hàm giúp mở URL trong thế giới phức tạp. Các URL có thể là một chuỗi hoặc một đối tượng Yêu cầu. 

Mặt khác, một ổ cắm giúp kết nối hai nút trên mạng để giao tiếp với nhau. Bạn có thể nhập thư viện ổ cắm, tạo một ổ cắm đơn giản và bắt đầu giao tiếp hai chiều. setdefaulttimeout() đặt thời gian chờ mặc định cho các socket mới. 

Đọc danh sách các IP proxy

Bạn phải đọc danh sách IP proxy trong proxyList như hình dưới đây.

proxyList = ['140.82.61.218:8080']

Dòng mã trên đại diện cho một IP proxy mẫu.

Xác định hàm

Để kiểm tra xem proxy của bạn có hoạt động hay không, bạn phải xác định một hàm như hình dưới đây.

def is_bad_proxy(pip):    
    try:        
        proxy_handler = urllib.request.ProxyHandler({'http': pip})        
        opener = urllib.request.build_opener(proxy_handler)
        opener.addheaders = [('User-agent', 'Mozilla/5.0')]
        urllib.request.install_opener(opener)        
        sock=urllib.request.urlopen('http://www.google.com')  
    except urllib.error.HTTPError as e:        
        print('Error code: ', e.code)
        return e.code
    except Exception as detail:

        print( "ERROR:", detail)
        return 1
    return 0

Ở đây

  • urllib.request.ProxyHandler khiến các yêu cầu đi qua proxy. 
  • urllib.request.build_opener trả về một phiên bản xâu chuỗi các trình xử lý theo thứ tự đã cho.
  • addheaders là một thuộc tính của urllib.opener(), và chúng ta cần thay đổi giá trị của nó thành một User-Agent được chấp nhận để đánh lừa trang web chúng ta đang truy cập.
  • Công urllib.request.install_opener cài đặt phiên bản OpenerDirector làm công cụ mở toàn cục mặc định. Cần phải cài đặt opener nếu bạn muốn urlopen sử dụng opener đó. Nếu không, bạn phải gọi OpenerDirector.open() thay vì urlopen(). 
đối với mục trong proxyList:
    Nếu is_bad_proxy (mục):
        print ("Bad Proxy", mục)
    Khác:
        in (mục, "đang hoạt động")

Hàm is_bad_proxy() phát hiện các proxy đang hoạt động trong danh sách IP proxy.

Trong đoạn mã trên, vòng lặp for lặp qua proxyList. Chúng tôi nhận được kết quả "Proxy xấu" nếu proxy không hoạt động. 

Sử dụng của một Proxy Checker

Có nhiều cách sử dụng cho trình kiểm tra proxy. Một số trong số họ được đưa ra dưới đây.

  • Tường lửa sử dụng trình kiểm tra proxy để đảm bảo tính ẩn danh tương đối của chúng trước khi tìm kiếm thông tin bị hạn chế trực tuyến.
  • Một người nào đó như quản trị viên trường học có thể sử dụng trình kiểm tra proxy để đảm bảo các máy chủ mạng hoạt động bình thường. Anh ta cũng có thể sử dụng nó để giám sát học sinh cố gắng vượt qua các hạn chế về tường lửa.
  • Các trang web thương mại điện tử, phương tiện truyền thông và các công ty phát thanh truyền hình sử dụng trình kiểm tra proxy để kiểm soát việc sử dụng dịch vụ theo địa lý của họ để nhắm mục tiêu tốt hơn các chiến dịch quảng cáo của họ.
  • Trình kiểm tra proxy bảo vệ các trang web thương mại điện tử khỏi các đơn đặt hàng lừa đảo và yêu cầu dữ liệu gian lận.
  • Trình kiểm tra hoặc quét proxy là những người bảo vệ ảo tuyến đầu chống lại tin tặc dữ liệu thử những cách mới để vượt qua các biện pháp bảo mật internet.

HTTP Proxy trực tuyến nào tốt nhất?

ProxyScrape là một trong những nhà cung cấp proxy trực tuyến phổ biến và đáng tin cậy nhất. Ba dịch vụ proxy bao gồm máy chủ proxy trung tâm dữ liệu chuyên dụng, máy chủ proxy dân dụng và máy chủ proxy cao cấp. Vì vậy, giải pháp tốt nhất có thể cho proxy HTTP tốt nhất là gì? Trước khi trả lời câu hỏi đó, tốt nhất bạn nên xem các tính năng của từng máy chủ proxy.

Một proxy trung tâm dữ liệu chuyên dụng phù hợp nhất cho các tác vụ trực tuyến tốc độ cao, chẳng hạn như truyền một lượng lớn dữ liệu (về kích thước) từ các máy chủ khác nhau cho mục đích phân tích. Đó là một trong những lý do chính khiến các tổ chức chọn proxy chuyên dụng để truyền một lượng lớn dữ liệu trong một khoảng thời gian ngắn.

Một proxy trung tâm dữ liệu chuyên dụng có một số tính năng, chẳng hạn như băng thông không giới hạn và kết nối đồng thời, proxy HTTP chuyên dụng để giao tiếp dễ dàng và xác thực IP để bảo mật hơn. Với 99,9% thời gian hoạt động, bạn có thể yên tâm rằng trung tâm dữ liệu chuyên dụng sẽ luôn hoạt động trong bất kỳ phiên nào. Cuối cùng nhưng không kém phần quan trọng ProxyScrape Cung cấp dịch vụ khách hàng tuyệt vời và sẽ giúp bạn giải quyết vấn đề của mình trong vòng 24-48 giờ làm việc. 

Tiếp theo là proxy dân cư. Khu dân cư là một proxy đi đến cho mọi người tiêu dùng nói chung. Lý do chính là địa chỉ IP của proxy khu dân cư giống với địa chỉ IP do ISP cung cấp. Điều này có nghĩa là việc xin phép máy chủ mục tiêu để truy cập dữ liệu của nó sẽ dễ dàng hơn bình thường. 

Các tính năng khác của ProxyScrapeProxy khu dân cư của là một tính năng xoay. Proxy xoay vòng giúp bạn tránh bị cấm vĩnh viễn đối với tài khoản của mình vì proxy khu dân cư của bạn tự động thay đổi địa chỉ IP của bạn, khiến máy chủ đích khó kiểm tra xem bạn có đang sử dụng proxy hay không. Nó là một công cụ tuyệt vời để quét web.

Ngoài ra, các tính năng khác của proxy dân cư là: băng thông không giới hạn, cùng với kết nối đồng thời, proxy HTTP / s chuyên dụng, proxy bất cứ lúc nào vì 7 triệu cộng với proxy trong nhóm proxy, xác thực tên người dùng và mật khẩu để bảo mật hơn và cuối cùng nhưng không kém phần quan trọng, khả năng thay đổi máy chủ quốc gia. Bạn có thể chọn máy chủ mong muốn của mình bằng cách thêm mã quốc gia vào xác thực tên người dùng. 

Cái cuối cùng là proxy cao cấp. Proxy cao cấp cũng giống như proxy trung tâm dữ liệu chuyên dụng. Các chức năng vẫn giữ nguyên. Sự khác biệt chính là khả năng tiếp cận. Trong proxy cao cấp, danh sách proxy (danh sách chứa proxy) được cung cấp cho mọi người dùng trên ProxyScrape'mạng lưới. Đó là lý do tại sao các proxy cao cấp có chi phí thấp hơn so với proxy trung tâm dữ liệu chuyên dụng.

Vì vậy, giải pháp tốt nhất có thể cho các proxy HTTP tốt nhất là gì? Câu trả lời sẽ là "proxy dân cư". Lý do rất đơn giản. Như đã nói ở trên, proxy khu dân cư là một proxy luân phiên, có nghĩa là địa chỉ IP của bạn sẽ được thay đổi động trong một khoảng thời gian, điều này có thể hữu ích để đánh lừa máy chủ bằng cách gửi nhiều yêu cầu trong một khung thời gian nhỏ mà không nhận được khối IP. 

Tiếp theo, điều tốt nhất sẽ là thay đổi máy chủ proxy dựa trên quốc gia. Bạn phải thêm ISO_CODE quốc gia vào cuối xác thực IP hoặc xác thực tên người dùng và mật khẩu. 

Câu hỏi thường gặp:

1. Các mẹo để sử dụng trình kiểm tra proxy là gì?
Những điều chính bạn cần tìm kiếm trong trình kiểm tra proxy là: 1. Kiểm tra vị trí (nơi đặt máy chủ proxy)2. Kiểm tra tốc độ của máy chủ proxy
2. HTTP proxy nào tốt nhất?
Proxy dân cư là proxy HTTP tốt nhất vì nó là proxy xoay, có nghĩa là địa chỉ IP của bạn sẽ được thay đổi động trong một khoảng thời gian, điều này có thể hữu ích để đánh lừa máy chủ bằng cách gửi nhiều yêu cầu trong một khung thời gian nhỏ mà không nhận được khối IP.
3. Công dụng của trình kiểm tra proxy python là gì?
1. Ẩn danh2. Hạn chế vượt qua các hạn chế tường lửa trong các tổ chức và trường học3. Truy cập các trang web Thương mại điện tử quốc tế4. Bảo mật chống lại các cuộc tấn công mạng5. Quét web dễ dàng

Kết thúc

Chúng tôi đã thảo luận rằng proxy là trung gian giữa máy khách và máy chủ. Các máy chủ proxy có thể hoạt động như một tường lửa, cung cấp các kết nối mạng được chia sẻ và dữ liệu bộ nhớ cache để tăng tốc các yêu cầu phổ biến. Chúng tôi có thể sử dụng trình kiểm tra proxy để kiểm tra proxy của mình để biết proxy nào đang hoạt động. Trước khi sử dụng trình kiểm tra proxy, chúng ta cần kiểm tra tốc độ và vị trí. Hơn nữa, chúng ta có thể tạo một trình kiểm tra proxy bằng Python bằng cách nhập các thư viện cần thiết và xác định chức năng kiểm tra proxy xác định bản chất của proxy, tức là chức năng hoặc phi chức năng. 

Tôi hy vọng bạn đã biết cách tạo trình kiểm tra proxy bằng Python.