Hệ thống được tạo ra để làm gì?
Traffic Tools V2 là nền tảng tự động hóa hai nghiệp vụ chính trong lĩnh vực SEO và bảo mật số. Hệ thống không phải một công cụ đơn lẻ — nó là một nền tảng phân tán gồm ba thành phần phối hợp với nhau: Admin Dashboard để người vận hành điều khiển, Go API Backend để lưu trữ và điều phối, và Tools V2 Worker để thực thi thực tế bằng Chrome thật trên các máy chủ riêng biệt.
Nghiệp vụ 1 — Tạo traffic thực cho website#
Tại sao phải dùng Chrome thật?#
Các hệ thống phân tích của Google, Cloudflare và các nền tảng quảng cáo hiện đại kiểm tra hàng chục tín hiệu cùng lúc để phân biệt người dùng thật với bot: fingerprint trình duyệt, cách di chuyển chuột, tốc độ gõ phím, lịch sử cookie, thời gian ở lại trang, JavaScript execution, và nhiều thứ khác.Nếu dùng HTTP request đơn thuần hoặc headless browser không được cấu hình đúng, các hệ thống này sẽ phát hiện và bỏ qua traffic — không tính vào số liệu thực, không tính phí quảng cáo. Tools V2 giải quyết vấn đề này bằng cách chạy Chrome thật với đầy đủ JavaScript engine, rendering engine và network stack, kết hợp với nhiều lớp kỹ thuật chống phát hiện.Năm loại traffic và mục đích của từng loại#
Worker tìm kiếm từ khóa trên Google, cuộn đến phần quảng cáo được đánh dấu "Tài trợ" hoặc "Sponsored", tìm đúng quảng cáo của domain mục tiêu, di chuyển chuột theo đư ờng cong tự nhiên rồi click vào. Sau khi click, Worker ở lại trang trong thời gian được cấu hình, cuộn trang, mô phỏng hành vi đọc nội dung.Mục đích: Mỗi click tính phí quảng cáo cho đối thủ. Làm đủ nhiều, ngân sách quảng cáo của họ cạn kiệt và quảng cáo tự tắt. Đây là loại traffic có độ phức tạp cao nhất vì cần tìm đúng quảng cáo của domain mục tiêu trong trang kết quả có thể chứa nhiều quảng cáo của nhiều domain khác nhau.Tương tự Google Ads nhưng sử dụng binary CocCoc thay vì Chrome và tìm kiếm trên CocCoc Search. CocCoc là trình duyệt phổ biến tại Việt Nam với hệ thống quảng cáo riêng. Phục vụ các chiến dịch quảng cáo chạy trên nền tảng CocCoc Ads.Organic Traffic (Traffic Tự Nhiên)Worker tìm kiếm từ khóa trên Google, tìm kết quả tự nhiên (không phải quảng cáo) của domain mục tiêu trong trang kết quả, click vào và duyệt trang trong thời gian đủ dài. Trong thời gian ở lại, Worker cuộn trang từ từ, đôi khi click vào các link nội bộ, mô phỏng hành vi đọc nội dung thực sự.Mục đích: Cải thiện tín hiệu CTR (Click-Through Rate) từ kết quả tìm kiếm, tăng thời gian trên trang và giảm bounce rate — ba yếu tố mà Google dùng để đánh giá chất lượng trang và quyết định thứ hạng SEO. Traffic này được Google Analytics ghi nhận là organic traffic thực sự.Direct Traffic (Home Traffic)Worker truy cập thẳng vào URL đích mà không qua tìm kiếm, mô phỏng người dùng đã biết địa chỉ website và vào trực tiếp. Đây là loại traffic phức tạp nhất vì hệ thống tự động tạo bốn biến thể thiết bị: Windows Desktop, macOS Desktop, Android Mobile và iOS Mobile. Mỗi biến thể có User-Agent, độ phân giải màn hình, và hành vi tương tác khác nhau — chuột cho desktop, touch events cho mobile.Mục đích: Direct traffic là tín hiệu mạnh về brand awareness. Khi nhiều người truy cập trực tiếp vào một website, điều đó cho thấy họ đã biết đến thương hiệu. Google và các analytics platform đánh giá cao loại traffic này.Worker tìm kiếm từ khóa liên quan đến domain đối thủ, click vào kết quả của họ, rồi thoát ra ngay lập tức sau thời gian rất ngắn (bounce). Hành vi này tạo ra bounce rate cao và thời gian trên trang thấp — hai tín hiệu tiêu cực mà Google dùng để đánh giá chất lượng trang.Mục đích: Làm giảm thứ hạng SEO của website đối thủ. Kill Flow có độ ưu tiên cao nhất trong hệ thống vì thư ờng được dùng trong các chiến dịch khẩn cấp cần tác động nhanh.Thứ tự ưu tiên thực thi: Kill Flow > Home Traffic > Google Ads > CocCoc Ads > Organic
Nghiệp vụ 2 — Gửi báo cáo bảo mật tự động#
Mục tiêu#
Hệ thống tự động gửi báo cáo về các domain vi phạm (phishing, malware, quảng cáo lừa đảo) đến hơn 100 nền tảng bảo mật toàn cầu. Khi một domain bị báo cáo đến đủ nhiều nền tảng, nó sẽ bị đưa vào danh sách đen — người dùng sẽ thấy cảnh báo khi truy cập, quảng cáo bị từ chối hiển thị, domain bị xóa khỏi kết quả tìm kiếm.Hai phương thức gửi báo cáo#
Qua trình duyệt (Browser-based)Worker mở Chrome, điều hướng đến trang báo cáo của nền tảng, điền form với nội dung được tạo bởi AI (GPT-4o-mini), giải CAPTCHA nếu có, submit form và chụp ảnh màn hình trang xác nhận làm bằng chứng.Mỗi nền tảng có yêu cầu riêng về nội dung báo cáo. Google Safe Browsing cần mô tả kỹ thuật về phishing. Spamhaus cần thông tin về spam infrastructure. Các hãng antivirus cần mô tả về malware behavior. Thay vì hardcode nội dung cho từng nền tảng, hệ thống dùng GPT-4o-mini với prompt template riêng cho từng nền tảng để tạo nội dung phù hợp và đủ đa dạng để tránh bị phát hiện là spam tự động.Các nền tảng lớn: Google Safe Browsing, Microsoft SmartScreen, Netcraft, ESET, Trend Micro, Mozilla Firefox, Adguard, Google Ads, TikTok, Google Play, US-CERT, X/Twitter, Microsoft, Spamhaus.Hệ thống soạn email bằng AI theo template của từng nền tảng và gửi đến địa chỉ abuse của họ qua SMTP (Gmail). Không cần mở trình duyệt. Phương thức này dùng cho các tổ chức nhận báo cáo qua email.Các nền tảng lớn: Kaspersky, ESET, Avast, Bitdefender, McAfee, Sophos, OpenPhish, Microsoft, Google, PayPal, và hơn 80 nền tảng khác từ danh sách VirusTotal vendors.Xử lý CAPTCHA tự động#
Nhiều nền tảng báo cáo dùng CAPTCHA để ngăn báo cáo tự động. Hệ thống có hai cơ chế:Anti-Captcha API (chính) — Gửi thông tin CAPTCHA đến dịch vụ Anti-Captcha, dịch vụ này dùng người thật hoặc AI để giải và trả về token. Hỗ trợ reCAPTCHA v2/v3, hCaptcha và image CAPTCHA. Timeout tối đa 5 phút, retry 3 lần.OpenAI Vision (dự phòng) — Khi Anti-Captcha API thất bại hoặc không hỗ trợ loại CAPTCHA cụ thể, hệ thống chụp screenshot vùng CAPTCHA và gửi đến GPT-4o-mini Vision API để nhận dạng và trả về answer.Bằng chứng báo cáo#
Sau mỗi báo cáo thành công, Worker chụp ảnh màn hình trang xác nhận và upload lên DigitalOcean Spaces hoặc Cloudinary. URL ảnh được gửi về API cùng với kết quả để Admin Dashboard hiển thị bằng chứng cho từng báo cáo.
Tại sao traffic được chấp nhận là thực?#
Hệ thống áp dụng nhiều lớp kỹ thuật độc lập để vượt qua các hệ thống phát hiện bot:Stealth patches — Xóa navigator.webdriver (dấu hiệu rõ ràng nhất của Puppeteer), patch navigator.plugins để hiển thị danh sách plugins thực, spoof WebGL vendor và renderer string, add noise vào canvas fingerprint và AudioContext fingerprint, disable WebRTC để tránh IP leak qua STUN servers, set timezone theo vùng địa lý của proxy.Ghost cursor — Thư viện ghost-cursor tạo chuyển động chuột theo đường cong Bezier tự nhiên. Không có đường thẳng, không có teleport — chuột di chuyển như người thực với overshoot và correction movements.Random timing — Tất cả hành động (gõ phím, nhấp chuột, cuộn trang) đều có độ trễ ngẫu nhiên trong khoảng hợp lý. Tốc độ gõ phím biến thiên, đôi khi có typo rồi sửa lại. Không có pattern cố định nào có thể bị phát hiện.Proxy rotation — Mỗi phiên dùng một proxy khác nhau. Proxy được chọn dựa trên lịch sử sử dụng, domain đã truy cập và trạng thái sức khỏe. Worker không tự chọn proxy — gọi API để nhận proxy phù hợp nhất.Browser profiles — Mỗi phiên có thể dùng profile khác nhau với cookie, localStorage và fingerprint khác nhau. Profile được tái sử dụng qua nhiều phiên để tạo lịch sử duyệt web tự nhiên. Google Anti-Bot kiểm tra tính nhất quán của fingerprint qua nhiều phiên — nếu hôm qua profile dùng Windows, hôm nay lại là MacOS, đó là dấu hiệu bất thường.Geolocation matching — Tọa độ GPS của trình duyệt được cấu hình khớp với vùng địa lý của proxy đang dùng. Không có sự mâu thuẫn giữa IP location và browser location.Thời gian đọc thực tế — Thời gian ở lại trang không phải con số cố định mà được tính dựa trên số lượng từ trong nội dung trang, tốc độ đọc trung bình của người Việt Nam (khoảng 200-250 từ/phút), cộng thêm random variance 20-30%.Resource blocking — Các request không cần thiết (font, analytics, tracking pixel) bị chặn để tăng tốc và giảm dấu vết. Chỉ load những gì cần thiết cho việc tìm kiếm và click.
Kiến trúc phân tán và khả năng mở rộng#
Hệ thống được thiết kế để chạy trên nhiều máy chủ vật lý cùng lúc. Mỗi máy chủ chạy một instance Tools V2 độc lập, tự đăng ký với Go API qua một định danh duy nhất (SERVER_ID). Go API phân phối tác vụ đều cho tất cả worker đang hoạt động.Khi cần tăng năng lực xử lý, chỉ cần thêm máy chủ mới và deploy thêm một instance Tools V2 — không cần thay đổi bất kỳ cấu hình nào trên các máy chủ hiện có. Khi một máy chủ gặp sự cố, các máy chủ còn lại tiếp tục hoạt động bình thường. Go API tự động ngừng phân phối tác vụ cho worker không phản hồi.Mỗi Chrome instance tiêu thụ khoảng 200-400MB RAM. Với server 16GB RAM, có thể chạy khoảng 28-30 Chrome instances đồng thời (để lại buffer cho hệ điều hành và các process khác). Các browser được khởi động cách nhau 3 giây để tránh spike CPU. Modified at 2026-03-31 03:36:45