Trong bài này chúng ta sẽ cùng tìm hiểu chi tiết cách login và crawl dữ liệu từ Facebook bằng Python nha.
Link github:
Xin chào các bạn, rất vui vì các bạn đã ghé thăm vlog Mì AI của tôi!
Sau 03 lần đầu bỏ cuộc với AI vì nản, tôi quyết định rằng mình không thể học theo cách tu luyện toán, lý thuyết suông vì quá là nản. Tôi chọn cách ngược lại, đề ra bài toán trong thực tế, làm đến đâu, cần lý thuyết tôi sẽ đọc lại. Có cái đích đến rõ là học dễ hơn và đỡ nản hơn.
Và thêm nữa, khi lướt quanh các diễn đàn thì có rất nhiều người giống tôi, cũng đang kêu trời với đống toán và rất rất nản. Với mong muốn chia sẻ chút kinh nghiệm học AI theo cách của mình nên vlog này ra đời.
Mong cả nhà ủng hộ và góp ý chân thành cho tôi!
#MìAI
Fanpage:
Group trao đổi, chia sẻ:
Website:
Youtube:
Tag: crawl dữ liệu, mì ai, ai, ainoodle, ai noodle, machine learning, deep learning, artificial intelligence, trí tuệ nhân tạo, lập trình ai, lập trình machine learning, live stream lập trình, facebook crawler, crawl data, facebook, facebook login, lấy dữ liệu facebook, crawl data python, crawl dữ liệu
Xem thêm: https://icongnghe.org/category/pc
Nguồn: https://icongnghe.org
41 Bình luận. Leave new
anh ơi cho em hỏi lưu file sau khi làm xong kiểu gì ạ?
Cái này có bị toang fb k a ơi
Thầy ơi cho nó kéo chuột xem hết trang như nào ạ
Hay quá bác ơi
video rất hay. cảm ơn anh nhé
hay quá a ạ
e nói thật video a dễ hiểu thật ý. Mong a ra nhiều video code về fb hơn để mọi người cùng học hỏi <3
Anh ơi, nếu em muốn crawl danh sách thành viên của group facebook thì em nên sử dụng công cụ nào ạ ?
a ơi tại sao e lấy tất cả element theo xpath là tất cả thẻ div có class là ''bp9cbjyn ue3kfks5 pw54ja7n uo3d90p7 l82x9zwi n1f8r23x rq0escxv j83agx80 bi6gxh9e discj3wi hv4rvrfc ihqw7lf3 dati1w0a gfomwglr'' khi chạy thì lúc nó lấy được list lúc thì k ạ, e có check là mấy lần không lấy được list thì class nó cũng tên vậy luôn chứ k đổi
anh ơi nếu em crawl 1 website mà content nó sử dụng lazyload thì sao ạ
em mở chrome lên rồi lại tắt luôn anh ạ mặc dù để sleep(5) . hàm sleep() có phải cài thêm thư viện gì k ạ mong a giúp em với
a ơi, e sử dụng facebook lite rồi, 11:57 mà nó ko điền thông tin ak
Nếu như e xài Cốc cốc thì s ak 6:56
cảm ơn anh, rất chi tiết và dễ hiểu
Thưa a hình như bây h facebook họ đổi giao diện mới mình không thể lấy được element như cách này được thì phải ạ, anh có thể hỗ trợ e cách lấy mới được k ạ?
cho em hỏi mình muốn save full trang html về luôn làm sao vậy anh
em chạy browser.find_elements_by_xpath("//div[@aria-label='Bình luận']") nhưng mà kết quả là 1 list rỗng thì phải sửa làm sao đây ạ, các bước trước thì em chắc chắn đúng hết rồi
Mấy cái file và tài liệu tiếng anh thầy tham khảo ở đâu vậy ạ có thể cho em xin link tiếng anh không ạ
Tuyệt vời thầy ơi <3
Anh ơi hình như FB đổi cách viết HTML rồi, em copy nguyên code của a chạy thử mà không crawl được nữa, anh có thể làm một video crawl mới được không ạ
Hay quá anh ơi! Không biết mình có thể áp dụng cách này để nuôi nick clone facebook không a?
Sử dụng selenium chỉ mở được hồ sơ khách thôi à anh, có cách nào mở được chrome hồ sơ 2 không anh
options.add_argument("user-data-dir=C:\Users\Users_Name\AppData\Local\Google\Chrome\User Data\Profile 2") – Cái này trên mạng thấy có hướng dẫn nhưng làm thì chạy không ra
cam on anh
Anh ơi nếu mình viết trên điện thoại thì chomer lấy đâu ra vậy anh
anh ơi, anh làm hướng dẫn cách ghi vào file excel luôn được không ạ
Dạ anh ơi cho em hỏi chỗ lệnh comment.find_element_by_class_name("") . Nếu em dùng phiên bản facebook cũ thì vẫn được bình thường còn khi facebook phiên bản mới em tìm không ra name class với id của comment để bỏ vào á anh @@
anh oi. cái dòng cmt_list = browser.find_element_by_xpath("//div[@aria-label='Bình luận']"). cái xpath đó mình lấy ở đâu vậy anh
Anh ơi có cách nào để crawl được data về comment trên tiki không ạ
hay quá anh ơi, cảm ơn anh
anh ơi,anh có thể hướng dẫn cách lấy link fb của người cmt rồi lấy thông tin tuổi tác,giới tính được không ạ
em cảm ơn anh
Anh ơi, e đang sử dụng Windown 64bit, nhưng trên web download chỉ có bản chrome 32 bit thôi ạ. Khi dung py gọi chrome ra thì nó báo lỗi "TypeError: 'module' object is not callable
"
Sự kiện mình kéo scroll lên xuống thì mình làm như nào vậy anh?
anh ơi em muốn hỏi có một số bình luận rất dài và phải bấm vào xem thêm thì mình nên chỉnh vòng lặp như nào để lấy được hết nội dung bình luận ạ?
cảm ơn anh nhiều!
Bác ơi con không tải được chrome drive 64 bit cho máy win, con cần làm gì hả Bác?
Cảm ơn anh đã chia sẻ, anh hướng dẫn thêm phần craw data từ phần quảng cáo fb về đi ạ :))
anh ơi, các variables như reaction (likes, heart,…) và sharing của comment có hiển thị ko a
anh ơi trong trường hợp chỉ dc login bằng gmail thì lm sao anh, cho em keyword với :3
anh cho em hỏi phần mềm anh dùng từ 5:23 là phần mềm nào ạ anh
mà tải cho window ntn ạ
em cảm ơn anh ạ
Thít mì dạng này