LinkedIn cung cấp nền tảng mạng xã hội hoàn hảo cho các chuyên gia với 660 triệu người dùng trong số 303 triệu người dùng hoạt động hàng tháng. Vì vậy, nếu bạn chưa tạo tài khoản LinkedIn, hãy tạo ngay hôm nay. Bạn có thể tiếp xúc với những người khổng lồ trong ngành. Trong bài viết này, chúng ta sẽ nói về cách thu thập email từ các tài khoản LinkedIn. Thường thì bạn có thể
LinkedIn cung cấp nền tảng mạng xã hội hoàn hảo cho các chuyên gia với 660 triệu người dùng trong số 303 triệu người dùng hoạt động hàng tháng. Vì vậy, nếu bạn chưa tạo tài khoản LinkedIn, hãy tạo ngay hôm nay. Bạn có thể giao lưu với những người khổng lồ trong ngành.
Trong bài viết này, chúng ta sẽ nói về cách thu thập email từ các tài khoản LinkedIn. Thông thường, bạn có thể cần địa chỉ email cho các quy trình tuyển dụng mà công ty bạn thường sử dụng hoặc cho các chiến dịch quảng cáo không xâm phạm.
Tuy nhiên, hầu hết người dùng sẽ ẩn địa chỉ email của họ vì lý do riêng tư. LinkedIn cũng cung cấp các cơ chế để che giấu các địa chỉ email đó khỏi chế độ xem công khai. Vì vậy, trong những trường hợp như vậy, cách duy nhất để truy cập địa chỉ email là thông qua việc thu thập dữ liệu.
Vì vậy, không cần phải nói thêm nữa, chúng ta hãy cùng tìm hiểu cách thực hiện thu thập email bằng LinkedIn. Nhưng trước tiên, chúng ta hãy cùng tìm hiểu lý do tại sao bạn cần thu thập dữ liệu từ LinkedIn.
Như đã đề cập trong đoạn giới thiệu, bạn có thể cần nó cho mục đích tuyển dụng hoặc tiếp thị. Để giải thích thêm một chút, hồ sơ người dùng trên LinkedIn có tên, địa chỉ email, kỹ năng có năng lực, kinh nghiệm chuyên môn, trình độ, v.v. Mặt khác, hồ sơ công ty có thông tin tuyển dụng , số lượng nhân viên, nhân viên hiện tại và nhiều dữ liệu quan trọng khác.
Vì vậy, LinkedIn có rất nhiều thông tin hữu ích cho mọi người.
Một số người dùng có thể sử dụng bot và trình thu thập thông tin để thu thập email và xây dựng danh sách email. Sau đó, họ sẽ bán những danh sách email này cho các nhà tiếp thị và các nhóm khác quan tâm đến dữ liệu này.
Nói như vậy, bạn cũng phải cân nhắc đến khía cạnh đạo đức của việc thu thập email. Thông thường, việc này được coi là phi đạo đức ngay cả khi mục đích không phải là ác ý. Tuy nhiên, hiệu quả của việc thu thập email LinkedIn để xây dựng mối quan hệ chuyên nghiệp không thể bị bỏ qua.
Vì vậy, phần tiếp theo sẽ tập trung vào tính hợp pháp của việc thu thập dữ liệu email theo quan điểm của LinkedIn thông qua một ví dụ.
Câu trả lời là một điều không nên làm để bạn hiểu rõ thông điệp. Tài liệu của LinkedIn về “Phần mềm và tiện ích mở rộng bị cấm” nghiêm cấm sử dụng trình thu thập thông tin, bot, rô-bốt, tập lệnh và bất kỳ tiện ích bổ sung hoặc plugin nào khác để thu thập thông tin từ trang web LinkedIn. Bạn có thể đọc thêm về cách sử dụng công cụ thu thập thông tin với LinkedIn từ liên kết ở trên để có cái nhìn tổng quan về nó.
LinkedIn đã thực thi hầu hết các quy tắc này để bảo vệ quyền riêng tư của thành viên. Tuy nhiên, có những vùng xám trong một số luật chống sao chép này. Tôi nói vậy vì trước đây, LinkedIn đã kiện 100 người sao chép ẩn danh vì sao chép dữ liệu từ LinkedIn. Nhưng vẫn chưa có phán quyết nào được đưa ra cho vụ việc. Điều này cũng là do LinkedIn đã không phân biệt được sao chép tốt với sao chép phá hoại.
Trường hợp trên đã dẫn đến việc nêu ra các vấn đề quan trọng trong quá trình thu thập dữ liệu. Tuy nhiên, chúng nằm ngoài phạm vi của bài viết này. Vì vậy, điều tôi đang cố gắng giải thích ở đây là nếu bạn có ý định thu thập dữ liệu từ LinkedIn, bạn cần biết rằng họ không thích điều đó. Do đó, bạn phải thực hiện đúng, điều mà bạn sẽ khám phá trong các phần tiếp theo.
Để thu thập email đúng cách, bạn cần cân nhắc một số yếu tố. Một số yếu tố quan trọng này là:
Vì vậy, trong phần tiếp theo, chúng ta sẽ xem xét phương pháp an toàn và hợp pháp nhất để thu thập địa chỉ email từ LinkedIn.
Đây là cách an toàn và hợp pháp nhất để thu thập email từ LinkedIn.
Trước khi hướng dẫn bạn các bước để xuất thủ công, một lời cảnh báo về phương pháp này; có một cài đặt quyền riêng tư mới trong LinkedIn chỉ cho phép truy cập đặc quyền vào ID email của người dùng. Theo mặc định, LinkedIn đã đặt cài đặt này thành "quyền riêng tư mạnh". Tuy nhiên, bạn có thể thay đổi cài đặt này thành tùy chọn "yếu hơn". Khi làm như vậy, bạn sẽ phải chịu sự kiểm soát của tin tặc, những kẻ có thể sử dụng địa chỉ email của bạn cho các hành vi độc hại.
Vì vậy, với phương pháp này, bạn chỉ có thể tải xuống địa chỉ email của những người liên hệ trực tiếp của mình. Ngoài ra, bạn chỉ có thể tải xuống những email đã thay đổi cài đặt quyền riêng tư mặc định thành "yếu hơn".
Dù sao thì sau đây là các bước bạn cần thực hiện để tải xuống email theo cách thủ công:
Sau đó, bạn sẽ nhận được email có chứa liên kết đến nơi trích xuất dữ liệu bạn yêu cầu.
Như bạn vừa thấy ở trên, khi sử dụng phương pháp thủ công, bạn sẽ chỉ nhận được một số ít kết quả. Do đó, bạn cần sử dụng một phương pháp thay thế dưới dạng các công cụ tự động hóa. Các công cụ tự động hóa này là các ứng dụng thu thập dữ liệu dành riêng cho LinkedIn. Chúng ta hãy cùng tìm hiểu một số công cụ trong số đó.
PhantomBuster - còn được gọi là LinkedIn profile scraper và là một ứng dụng dựa trên đám mây. Các nhà quản lý nhân sự và nhà tuyển dụng thường sử dụng nó để trích xuất dữ liệu có giá trị như địa chỉ email từ các ứng viên hoặc nhân viên tiềm năng. Nếu hồ sơ mục tiêu là "kết nối trực tiếp", bạn có thể trích xuất thông tin chi tiết một cách dễ dàng. Tuy nhiên, đối với "kết nối gián tiếp", việc trích xuất email trở nên khó khăn. Bạn có thể tìm thêm thông tin về công cụ này tại đây .
Octoparse – Đây là một công cụ trích xuất dữ liệu web rất thông minh vì nó chỉ sử dụng ba bước để thu thập dữ liệu. Đầu tiên, nó tìm dữ liệu, chọn dữ liệu và sau đó xuất dữ liệu. Nó cung cấp nhiều tùy chọn để lưu dữ liệu, ở định dạng CSV, XLSX hoặc các nền tảng khác nhau bằng cách sử dụng khóa API. Với nó, bạn có thể sử dụng máy chủ proxy để che giấu địa chỉ IP của mình hoặc sử dụng tính năng xoay vòng IP tự động để tránh lệnh cấm LinkedIn. Đọc thêm để biết thêm về Octoparse.
SalesQL- Công cụ này miễn phí và là tiện ích mở rộng của trình duyệt Google Chrome. Vì vậy, bạn có thể dễ dàng thêm nó vào trình duyệt Chrome của mình. Các đại diện bán hàng và nhà tuyển dụng thường sử dụng công cụ này để thu thập email từ LinkedIn. Bất kể kết nối có phải là kết nối hạng nhất hay không, bạn đều có thể trích xuất chúng. Bạn có thể xuất danh bạ sang tệp CSV/Excel, ATS (phần mềm HR) hoặc CRM. Vui lòng tìm hiểu thêm thông tin về SalesQL tại đây .
Để trích xuất dữ liệu từ một số công cụ trích xuất dữ liệu ở trên, bạn nên biết cách thiết lập các thông số sau:
Chủ đề
Luồng là số lượng kết nối hiện đang mở mà bạn đang sử dụng để thu thập dữ liệu từ LinkedIn hoặc bất kỳ trang web nào khác. Số luồng càng nhiều thì quá trình thu thập dữ liệu càng nhanh. Tuy nhiên, LinkedIn sẽ nhanh chóng đánh dấu bạn.
Vì vậy, mặc dù nhiều trình thu thập dữ liệu đặt 10 proxy cho mỗi luồng, lựa chọn tốt nhất là sử dụng một luồng cho mỗi proxy. LinkedIn sẽ nghi ngờ rằng cuối cùng bạn có thể phải ra tòa, mặc dù nó có thể làm chậm quá trình thu thập dữ liệu.
Thời gian chờ
Timeout là khoảng thời gian cần thiết để máy chủ phản hồi proxy trước khi proxy bắt đầu yêu cầu mới. Nhiều trình thu thập dữ liệu đặt thời gian chờ là 1 hoặc 2 giây. Khi đó, nó sẽ làm quá tải kết quả. Tuy nhiên, chúng tôi không khuyến nghị điều này và bạn cần đặt thời gian chờ ở mức cao hơn, chẳng hạn như 20-30 giây. Điều này giúp máy chủ tạm dừng trước khi chấp nhận yêu cầu mới.
Trong phần cuối này, bạn sẽ khám phá cách thu thập thông tin hồ sơ cá nhân. Tuy nhiên, việc thu thập thông tin hồ sơ cá nhân để tìm email và các thông tin chi tiết khác sẽ gây ra các vấn đề pháp lý cho LinkedIn. Lý do là khi bạn tạo tài khoản LinkedIn, LinkedIn cam kết sẽ bảo vệ dữ liệu của bạn và không tiết lộ cho bên thứ ba.
Bạn có thể thu thập dữ liệu của ai đó, bao gồm địa chỉ email, cho mục đích không phá hoại. Chúng bao gồm có thể bạn đang tìm việc và đang tìm kiếm các nhà văn kỹ thuật tự do ở một thành phố cụ thể. Mặt khác, bạn có thể đang thu thập dữ liệu để nghiên cứu. Vì vậy, hãy cùng tìm hiểu cách thu thập hồ sơ cá nhân.
Cách lý tưởng để thu thập thông tin từ hồ sơ cá nhân là tạo một tài khoản người dùng. Sau đó, bạn có thể kết nối với nhiều liên hệ nhất có thể. Tuy nhiên, sẽ hữu ích nếu bạn nhớ rằng tài khoản này không phải để kết nối với mọi người. Thay vào đó, hãy sử dụng nó làm điểm vào LinkedIn cho mục đích thu thập thông tin.
Tôi khuyên bạn nên sử dụng Octoparse cho mục đích này. Bởi vì nó cho phép bạn đăng nhập vào LinkedIn bằng tài khoản của mình và áp dụng các tìm kiếm phù hợp. Sau đó, bạn có thể cạo bằng tính năng kéo và thả trong khi hiển thị trang LinkedIn bạn đang truy cập.
Sau khi tạo tài khoản và khi bạn đã sẵn sàng tìm kiếm với Octoparse, bạn cần tìm hiểu xem cần tìm kiếm gì. Sau đó, Octoparse sẽ khám phá chính xác những gì bạn yêu cầu. Tuy nhiên, bạn chỉ có thể thu thập thông tin có sẵn dưới dạng không kết nối, bao gồm cả địa chỉ email của các liên hệ.
LinkedIn có khả năng sẽ chặn bạn bằng phương pháp trên nếu bạn không tuân thủ các quy tắc về thời gian chờ và chủ đề.
Ngoài ra, hãy đảm bảo rằng khi bạn tạo tài khoản, hãy sử dụng máy chủ proxy và sử dụng cùng một địa chỉ IP khi thu thập thông tin qua Octoparse. Điều này là do bạn xuất hiện như một con người trên LinkedIn vì hầu hết con người không truy cập LinkedIn từ các địa chỉ IP khác nhau trong tích tắc. Vì vậy, nếu bạn sử dụng proxy để tạo tài khoản, hãy sử dụng cùng một proxy khi thu thập thông tin trên LinkedIn.
Bây giờ vấn đề là sử dụng proxy nào và sử dụng bao nhiêu proxy.
Sử dụng proxy nào để thu thập dữ liệu trên LinkedIn?
Proxy lý tưởng để thu thập dữ liệu LinkedIn là proxy ưu tú . Lý do là vì proxy ưu tú cung cấp tính ẩn danh cao hơn và cài đặt tiêu đề an toàn hơn so với các loại proxy khác.
Trước khi thu thập, bạn cần biết rõ rằng LinkedIn không thích thu thập từ nó và xử lý nghiêm túc những thủ phạm. Điều này ngụ ý rằng bạn phải sử dụng proxy Elite chuyên dụng và proxy riêng Elite. Proxy dùng chung hoặc miễn phí đơn giản là không phù hợp cho mục đích này.
Số lượng Proxy
Số lượng proxy sẽ phụ thuộc phần lớn vào kích thước mà bạn sẽ thu thập. Như đã đề cập ở trên, khi sử dụng một proxy duy nhất cho mỗi tài khoản, bạn nên sử dụng 50 tài khoản và 50 proxy.
Giả sử bạn muốn có nhiều proxy hơn cho mỗi tài khoản mà chúng tôi không khuyến khích, hãy sử dụng trong khoảng từ 100-150. Sau đó, hãy luân phiên chúng thường xuyên để LinkedIn không phát hiện và cấm chúng.
Mặt khác, nếu bạn có ít proxy hơn, LinkedIn có thể sẽ cấm chúng. Vì vậy, để xác định con số tốt nhất, bạn phải thử nghiệm càng nhiều càng tốt với LinkedIn. Điều này cũng sẽ giúp bạn xác định xem có proxy nào của bạn bị LinkedIn đưa vào danh sách đen không.
Sau khi đọc bài viết này, chúng tôi hy vọng bạn có một ý tưởng toàn diện về cách bạn có thể thu thập email thông qua LinkedIn. Cách dễ nhất và rõ ràng nhất là sử dụng phương pháp thủ công. Tuy nhiên, cách đó sẽ không trả về một số ít kết quả. Vì vậy, lựa chọn rõ ràng nhất sẽ là sử dụng một công cụ tự động cùng với các proxy ưu tú.
Chúng tôi chúc bạn may mắn khi trích xuất email từ LinkedIn bằng các phương pháp được đề cập ở đây.