Halo semuanya kali ini saya akan share cara untuk scrapping website Tokuzilla. Hal hal yang perlu dipersiapkan adalah
- Python
- Pycharm
Pertama buat project baru, dan siapkan venv
Setelah itu kita install requests library
pip install requests
selanjutnya install bs4
pip install beautifulsoup4
import requests
from bs4 import BeautifulSoup
selanjunya kita buat variable url
url = 'https://tokuzilla.net/page/1'
kemudian buat variable headers untuk menyimpan User-Agent
headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 '
'Safari/537.36'
}
terakhir gunakan url dan headers menggunakan requests
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
print(soup)
Artikel selanjutnya akan membahas mengenai pagination