This page is READ-ONLY. It is generated from the old site.
All timestamps are relative to 2013 (when this page is generated).
If you are looking for TeX support, please go to VietTUG.org

Lượm hàng ở ubuntu-vn

Added by over 3 years ago

Để lấy số liệu cho minh họa, cách đơn giản là dùng wget. Để công việc trở nên có phần lịch sự, cần thêm các tham số xác định user-agent. Tuy nhiên, công việc không hẳn là đơn giản.

Trong các số liệu đã lấy, thông tin về các thành viên là khó gặm nhất. Các diễn đàn chỉ cho công bố thông tin này với các thành viên (có đăng ký).

Cách đầu tiên có thể nghĩ tới là xác định các cookie, nạp vào bằng wget. Cách này áp dụng thành công với trang http://vnoss.org/. Tuy nhiên, bằng một cơ chế thông minh, ubuntu-vn sẽ đá bạn bay sau lần kết nối thành công đầu tiên. Sau một hồi tìm kiếm, bạn (có thể) sẽ phát hiện ra rằng diễn đàn này không cho phép dùng cùng thông tin cookie từ hai địa chỉ IP khác nhau. Nhưng ngay cả khi loại bỏ hạn chế này, bạn vẫn không thể sử dụng wget với thông tin về cookie đã có.

Tại sao?

Câu chuyện thật đơn giản: mỗi lần truy cập, cookies của bạn sẽ được thay mới, và bạn phải sử dụng thông tin mới cho lần truy cập kế tiếp. Cơ chế để wget thành công thông tin về người dùng ở ubuntu-vn như sau

  1. tạo cookies.txt hợp lệ sau khi đăng nhập với tài khoản tại trang web
  2. dùng wget nạp cookies.txt ở trên để tải về trang xyz
  3. trong quá trình tải trang xyz, lưu cookies mới thu được vào cookies.new
  4. chuyển nội dung của cookies.new qua cookies.txt
  5. quay lại bước đầu tiên

That's all:)


Comments