Anda juga dapat memuat beberapa halaman web sekaligus. Untuk melakukan ini, Anda dapat mengoper daftar URL ke pemuat, yang akan mengembalikan daftar dokumen dalam urutan URL yang dioper.
Anda dapat mempercepat proses pengikisan dengan mengikis beberapa URL secara bersamaan.
Ada batas yang wajar untuk permintaan bersamaan, yang standarnya adalah dua per detik. Jika Anda tidak khawatir dengan beban server, atau jika Anda mengontrol server tempat Anda mengikis, Anda dapat meningkatkan jumlah maksimum permintaan bersamaan dengan mengubah parameter requests_per_second. Hal ini dapat mempercepat pengikisan, tetapi Anda harus berhati-hati karena Anda mungkin akan diblokir oleh server.
# Jalankan pada jupyter notebook(asyncio)import nest_asyncionest_asyncio.apply()
# Mengatur jumlah permintaan per detikloader.requests_per_second =1# Muat datadocs = loader.aload()
# Keluarkan hasilnyadocs
Menggunakan proxy
Anda mungkin perlu menggunakan proxy untuk menerobos pemblokiran IP.
Untuk menggunakan proxy, Anda dapat mengoper kamus proxy ke pemuat (dan request di bawahnya).