Scrapping Tokuzilla menggunakan bs4

May 29, 2023

Halo semuanya kali ini saya akan share cara untuk scrapping website Tokuzilla. Hal hal yang perlu dipersiapkan adalah

Python
Pycharm

Pertama buat project baru, dan siapkan venv

Setelah itu kita install requests library

pip install requests

selanjutnya install bs4

pip install beautifulsoup4

import requests
from bs4 import BeautifulSoup

selanjunya kita buat variable url

url = 'https://tokuzilla.net/page/1'

kemudian buat variable headers untuk menyimpan User-Agent

headers = {
    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 '
                  'Safari/537.36'
}

terakhir gunakan url dan headers menggunakan requests

res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')

print(soup)

Artikel selanjutnya akan membahas mengenai pagination

Scrapping Tokuzilla menggunakan bs4

Written by AlfaRiza

No responses yet