Mtaalam wa Semalt Anatoa Mwongozo wa Kuvua Wavuti Na Javascript

Kukata taka kwenye wavuti kunaweza kuwa chanzo bora cha data muhimu ambayo hutumika katika mchakato wa kufanya maamuzi katika biashara yoyote. Kwa hivyo, iko katika msingi wa uchambuzi wa data kwani ndio njia moja ya uhakika ya kukusanya data ya kuaminika. Lakini, kwa sababu kiwango cha yaliyomo kwenye mkondoni inapatikana kila wakati kuongezeka, inaweza kuwa vigumu kuvua kila ukurasa kwa mikono. Hii inahitaji automatisering.

Wakati kuna zana nyingi huko ambazo zimebuniwa miradi tofauti ya chakavu, wengi wao ni malipo na watagharimu pesa nyingi. Hapa ndipo Puppeteer + Chrome + Node.JS inapoingia. Mafunzo haya yatakuongoza kupitia mchakato kuhakikisha kwamba unaweza kugundua tovuti kwa urahisi kiatomati.

Usanidi hufanyaje kazi?

Ni muhimu kutambua kuwa kuwa na maarifa kidogo kwenye JavaScript utakuja kusaidia katika mradi huu. Kwa wanaoanza, italazimika kupata programu 3 zilizo hapo juu kando. Puppeteer ni Maktaba ya Node ambayo inaweza kutumika kudhibiti Chrome isiyo na kichwa. Chrome isiyo na kichwa inahusu mchakato wa kuendesha chrome bila GUI yake, au kwa maneno mengine bila kuendesha chrome. Utalazimika kusanikisha Node 8+ kutoka kwa tovuti yake rasmi.

Baada ya kusanikisha programu hizo, ni wakati wa kuunda mradi mpya ili kuanza kubuni nambari. Kwa kweli, ni kuvinjari kwa JavaScript kwa kuwa utakuwa ukitumia nambari kusasisha mchakato wa ujuaji. Kwa habari zaidi juu ya Puppeteer rejea nyaraka zake, kuna mamia ya mifano inapatikana kwako kucheza karibu nao.

Jinsi ya aateng'inua chakavu cha JavaScript

Kwenye kuunda mradi mpya, endelea kuunda faili (.js). Kwenye mstari wa kwanza, itabidi uite utegemezi wa Puppeteer ambao ulikuwa umeweka mapema. Hii inafuatwa na kazi ya msingi "GetPic ()" ambayo itashikilia nambari yote ya otomatiki. Mstari wa tatu utatongoza kazi ya "GetPic ()" ili kuiendesha. Kuzingatia kwamba kazi ya GetPic () ni kazi ya "async", basi tunaweza kutumia usemi unaosubiri ambao utasimamisha kazi wakati unangojea "ahadi" ya kusuluhisha kabla ya kuendelea kwenye safu inayofuata ya nambari. Hii itafanya kazi kama kazi ya msingi ya otomatiki.

Jinsi ya kupiga simu isiyo na kichwa

Mstari unaofuata wa nambari: "const browser = inangojea puppeteer.Uzinduzi ();" itazindua kijiografia na itaendesha mfano wa chrome kuiweka kwenye muundo wetu wa "kivinjari" kipya. Endelea kuunda ukurasa ambao utatumika kwenda kwa URL ambayo unataka kuipaka.

Jinsi ya chakavu data

Puppeteer API hukuruhusu kucheza karibu na pembejeo tofauti za wavuti kama vile saa, kujaza fomu na vile vile kusoma data. Unaweza kuirejelea ili kupata mtazamo wa karibu juu ya jinsi unaweza kurekebisha michakato hiyo. Kazi ya "chakavu ()" itatumika kuingiza msimbo wetu wa chakavu. Kuendelea kutekeleza node scrape.js kazi ya kuanzisha mchakato wa kukwamua. Usanidi wote unapaswa basi moja kwa moja kuanza kutoa bidhaa zinazohitajika. Ni muhimu kukumbuka kupitia nambari yako na uangalie kuwa kila kitu kinafanya kazi kulingana na muundo ili kuepuka kujiingiza kwenye makosa njiani.