Scrapping Tokuzilla menggunakan bs4

AlfaRiza
May 29, 2023

--

Halo semuanya kali ini saya akan share cara untuk scrapping website Tokuzilla. Hal hal yang perlu dipersiapkan adalah

  • Python
  • Pycharm

Pertama buat project baru, dan siapkan venv

Setelah itu kita install requests library

pip install requests

selanjutnya install bs4

pip install beautifulsoup4
import requests
from bs4 import BeautifulSoup

selanjunya kita buat variable url

url = 'https://tokuzilla.net/page/1'

kemudian buat variable headers untuk menyimpan User-Agent

headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 '
'Safari/537.36'
}

terakhir gunakan url dan headers menggunakan requests

res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')

print(soup)

Artikel selanjutnya akan membahas mengenai pagination

--

--

AlfaRiza
AlfaRiza

No responses yet