Računalniki Windows internet

Razčlenjevalnik vsebine Wordpress. Brezplačni razčlenjevalnik vsebine - AftParser. Parser za WordPress lahko

Precej zmogljiv univerzalni razčlenjevalnik za WordPress. Omogoča vam, da zberete vsebino iz enega ali več virov in jo obdelate ter jo prilagodite zahtevani obliki z uporabo vseh zmožnosti jezika PHP. Obstaja možnost odloženega razčlenjevanja. Najboljši brezplačni razčlenjevalnik Wordpress tega trenutka - AftParser vam je vedno na voljo!

Kratek opis funkcionalnosti:

Razčlenjevalnik je sestavljen iz 4 strani: glavna stran, stran razčlenjevalnika povezav, stran razčlenjevalnika virov RSS in stran z nastavitvami. Takole bo videti po namestitvi:

Pozor: Lahko preberete, kako konfigurirati AftParser.

Začnimo z domača stran... Prikaže seznam trenutno delujočih razčlenjevalnikov.

Pojasnila so podana v blokih na vsaki strani. Vsa dokumentacija pride iz škatle, preberite jo dovolj pozorno, da bo jasno.

Razčlenjevalnik spletnega mesta:

Stran razčlenjevalnika spletnega mesta vam omogoča razčlenjevanje podatkov iz enega ali več virov. Navesti morate samo povezave do gradiva.

Kaj? Ste preveč leni, da bi kopali po mreži in ročno zbirali materiale? Ne obupajte – vse je avtomatizirano.

Obstajata dve orodji, ki vam omogočata samodejno izpolnjevanje seznama povezav.

- neke vrste emulacija iskalnik... Robot se bo sam sprehajal po straneh spletnega mesta, ki so mu bile prenesene, in z njih zbiral vse notranje povezave.

Seveda bo seznam povezav, napolnjen s samodejnimi algoritmi, močno poln nepotrebnih podatkov. In takrat vam na pomoč priskočijo filtri.

- najbolj preprosta in hiter način filtracija. Vnesete pogoje in filter sam opravi obdelavo.

Napredni filter povezav- filter povezav, ki vam omogoča, da spremenite njihovo vsebino in naredite kup različnih stvari. Samo za napredne uporabnike. Svetujem vam, da se naučite php, preden tam kaj počnete.

Če ste opravili zbiranje povezav, je naslednji korak dodajanje meja vsebine.

S pomočjo teh meja bo razčlenjevalnik določil področja, ki jih je treba obdelati.

Osvetlitev sintakse se izvaja s pomočjo urejevalnika javascript ACE. Vsa dokumentacija in vse razpoložljive funkcije so navedene na strani vtičnika. Seznam je zelo impresiven in ga tukaj ne morem podati, saj je to gradivo že zelo dolgo. Samo namestite vtičnik in ga preberite, navdušeni boste, zagotavljam.

Stran je videti približno enako. razčlenjevalnik virov rss, z edino razliko, da ni treba zagotoviti seznamov povezav.

Obstaja kar nekaj področij dejavnosti, kjer je mogoče uporabiti razčlenjevalnik, predvsem pa je to zbiranje različnih informacij. Slike in povezave lahko hitro zbirate samo programsko. Uporaba razčlenjevalnika za iskanje informacij vam omogoča avtomatizacijo tega postopka, kar znatno prihrani čas. Če imate spletno mesto wordpress, ga lahko preprosto samodejno dokončate s pomočjo razčlenjevalnika AftParser.

Je brezplačen, univerzalni razčlenjevalnik WordPress. vam omogoča zbiranje vsebine iz enega ali različnih virov in obdelavo v želeno obliko na PHP jezik... Razčlenjevalnik je narejen kot vtičnik za WordPress. Po običajni namestitvi vtičnika se bo v wordpress konzoli prikazal meni razčlenjevalnika, kot je na sliki.

V razčlenjevalniku sta implementirani dve glavni orodji: razčlenjevalnik za mesta wordpress in razčlenjevalnik rss za wordpress.

Razčlenjevalnik za WordPress lahko:

1.Razčlenitev podatkov za povezave

Navesti morate le povezave do vira. Če povezav ni, jih je mogoče zbrati z razčlenjevalnikom. Določite pot do zemljevida spletnega mesta in grabber bo zbral vse povezave. Ali pa lahko zbirate povezave od katerega koli html stran... Povezave je mogoče filtrirati glede na zahtevane kriterije. Obstajata dva filtra povezav, s katerima lahko spremenite pogoje razčlenjevanja. Izkušeni uporabniki lahko sami sestavljajo makre za razčlenjevanje, zaradi česar je razčlenjevalnik zelo prilagodljiv, da ustreza njihovim potrebam.

2.Razčlenitev podatkov iz virov RSS

Tukaj je vse preprosto, vnesite želeni URL vira in kliknite Začni razčlenjevanje.
Ena od možnih uporab razčlenjevalnika za wordpress je polnjenje stolpcev z novicami na vašem spletnem mestu z uporabo virov informacij, kot so blogi, viri rss, strani VKontakte itd. Tekmovalci - WP-O-Matic, FeedWordPress, CyberSyn.

Predstavljam vam univerzalno WordPress grabber WP UniParser... Ta vtičnik je univerzalni razčlenjevalnik po meri... Pri ustvarjanju objav lahko vtičnik prevaja vsebino preko Googlova storitev Prevajajte s poljubnimi jezikovnimi pari.

Ocene strank

Temo o srcu, kjer je bilo približno 6-7 ocen, so moderatorji izbrisali (pravijo, da izdelek ne ustreza pravilom foruma). Kljub temu je na forumu mulenet in armada mogoče najti eno oceno. Obstajajo tudi ocene blogerjev: tu in tam. Pred kratkim sem po naključju naletel na recenzijo.

Osnovna funkcionalnost

Vtičnik WP UniParser, ki sem ga ustvaril, lahko naredi naslednje:
črpati vsebino iz strani na vseh motorjih(razčlenjevalnik je konfiguriran z uporabo regularnih izrazov in omejitvenih nizov, konfiguracija je zelo preprosta, vse bom razložil in pokazal, poleg tega pa obstaja en zanj);
izrežite skripte, komentarje, povezave, obrazce, slike, razpone, predmete, pa tudi vse fragmente, ki jih določite iz vsebine.
urnik objave objave;
razčlenjene materiale postavite v kategorijo, ki ste jo definirali (ali jih naključno porazdelite v kategorije);
zavedati se avtomatsko prevajanje(v kateri koli smeri) v vseh jezikih, ki jih podpira Google prevajalnik.

Nabor funkcij vtičnika lahko podrobneje najdete na posnetku zaslona njegove skrbniške plošče:

Tudi za popolno razumevanje dela univerzalnega grabilca je vredno.

Včasih ni smiselno porabiti časa za pisanje besedila za svoje spletno mesto WordPress. Ta primer ne velja za bloge in informativna spletna mesta, saj se dohodek na njih ustvarja prav zaradi objavljenih objav.

In govorimo o spletnih trgovinah, spletnih mestih podjetij in novičarskih portalih, ki niso zasnovani za organski promet. Za takšne vire edinstveni materiali niso tako pomembni kot njihovo nenehno posodabljanje.

Če želite ustvariti spletno mesto, ki ga je mogoče samodejno izpolnjevati, boste morali za svoj projekt nastaviti razčlenjevalnik novic. Najprej morate najti primerna spletna mesta, s katerih boste razčlenili. Morajo ustrezati temi vašega projekta, sicer nima smisla podvajati informacij iz njih. Če je tako, potem morate nadaljevati z drugim delom rešitve težave z razčlenjevanjem - tako boste klonirali besedilo z drugega mesta. Najbolj primitiven in neprimeren način je ročno kopiranje. Vendar je veliko pametneje uporabiti enega od vtičnikov, navedenih v tem članku, da aktivirate razčlenjevalnik dobrih novic in vsebin.

WP-O-Matic

Zelo priljubljen vtičnik WordPress, ki vam omogoča nastavitev funkcionalnega razčlenjevalnika novic z drugih spletnih mest. Orodje je nameščeno največ na preprost način: bodisi z nalaganjem neposredno v mapo na gostovanju bodisi prek zavihka "Vtičniki".

Nato morate konfigurirati vtičnik, da deluje, če želite zagotoviti razčlenjevanje vsebine. Če želite to narediti, štirikrat kliknite »Naprej« in na koncu »Pošlji«. Tako se strinjate s pogoji uporabe tega modula WordPress. Zlasti se strinjate, da ste samo vi odgovorni za krajo materialov drugih ljudi, vsebin z drugih strani itd.

Če vas poleg besedilne komponente zanimajo tudi slike, potem morate v mapi vtičnikov ustvariti imenik z imenom Cache. Nastavite posebna dovoljenja za to mapo. Nato se morate vrniti v skrbniško območje WordPress. Pojdite na nastavitve vtičnika in natančno preverite, ali je poleg elementa Unix cron kljukica. Potrditev predpomnilnika morate potrditi, da bo razčlenjevalnik novic tudi kopiral slike v vaš vir.

Modul WP-O-Matic je dober, ker deluje na kateri koli strani spletnega mesta. Dodate lahko ločeno kategorijo, če želite, da je seznam novic in vsebine, ki jo zagotavlja razčlenjevalnik, prikazan točno tam. Če želite to narediti, najprej ustvarite zahtevani naslov. Nato v skrbniku WordPress v nastavitvah orodja WP-O-Matic kliknite Dodaj akcijo. V vrstici Kategorije potrdite polje za kategorijo po meri, ki ste jo ustvarili. In v obliki Feeds napišite RSS viri ki jih boste razčlenili. Za vire lahko registrirate več URL-jev hkrati, tako da razčlenjevalnik besedil zbira informacije iz treh ali celo štirih virov hkrati.

In še en velik plus vtičnika WP-O-Matic je avtomatska objava gradiva. Ni se vam treba vsako uro prijaviti v skrbnika WordPressa, da spremenite stanje objav v Objavljeno. Modul bo to naredil sam. In če želite, lahko unikatizira besedilo s posebnim mehanizmom sinonimizacije. To je ključna razlika. to orodje od svojega konkurenta, vtičnika FeedWordPress.

Datacol

To je funkcionalni grabber, ki ni primeren samo za WordPress motor. To ni samo razčlenjevalnik besedila strani spletnega mesta - je pametna aplikacija, ki vam omogoča filtriranje kopiranega gradiva. Objavljate lahko na primer samo članke, ki vsebujejo določene ključne besede... Novice lahko podvojite neposredno iz Yandexa. Klonirani materiali bodo izvoženi v enem od 15 razpoložljivih formatov. Storitev ne bo zbirala le besedila, temveč tudi naslove, fotografije, datum objave, povezave in druge pomembne podatke.

Toda Datacol je plačan. Je pa veliko ceneje, kot če bi material naročili na spletnem mestu prek menjalnic. Aplikacija stane manj kot 500 rubljev in se lahko uporablja za skoraj vsak motor. Obstaja demo različica.

FDE Grabber

Še en plačan razčlenjevalnik z veliko funkcijami. To je že iz kategorije dragih grabežljivcev, saj bo stalo približno 90 dolarjev. Vendar ga bo mogoče uporabiti na 10 strežnikih hkrati, torej teoretično lahko različni spletni skrbniki vnesejo za 9 $, s čimer se nakup poceni.

FDE Grabber v resnici ni vtičnik za WordPress. Razvijalci svojo ustvarjanje imenujejo samostojen sistem, ki deluje ne glede na vrsto CMS, nameščenega na spletnem mestu. Glavne značilnosti tega sistema razčlenjevanja:

  • nalaganje novic v celotnem obsegu ali posameznih fragmentov;
  • lahko načrtujete objave;
  • če želite edinstveno podvojiti material, je vgrajena funkcija sinonimizacije;
  • lahko delate prek proxy strežnikov;
  • razčlenjevanje lahko zaobide preusmeritve, kar je lahko težava za druge vtičnike;
  • lahko samodejno prenesete vso vsebino s strani in jo premaknete na svojo stran (če ne gre za novičarski portal);

Razčlenitev lahko popolnoma prilagodite po lastni presoji, saj ima program možnost implementacije vdelane programske opreme za popravljanje dela. Tako lahko na primer prilagodite poravnavo in postavitev kopiranega materiala. Dodate lahko tudi parametra noindex in nofollow za vse povezave, ki bodo v besedilu strani. Razčlenjevalnik vam omogoča celo kopiranje in samodejno prevajanje člankov iz tujih virov. tole odličen način ustvarite stalen tok vsebine na svoje strani, ki bo sčasoma začela privabljati obiskovalce!

Parser za WordPress je nastavitev Datacol, zasnovana za zbiranje vsebine (novice, članki, ocene itd.) nadaljnji izvoz v CMS WordPress.

V tem primeru je nastala vsebina izvožena v. Rezultati za vsako objavo se shranijo v ločeno datoteko, katere ime se generira na podlagi imena objave, vsebina pa temelji na razčlenjenih informacijah. Nastavite lahko tudi neposredni izvoz v svoj blog WordPress. Kako to storiti, je prikazano v videoposnetku.

Delovanje razčlenjevalnika za WordPress lahko brezplačno preverite v demo različici programa.
Glavne prednosti razčlenjevalnika, ki temelji na Datacol za WordPress, so:

  • Možnost prilagajanja razčlenjevanja za WordPress posebej za vaše potrebe (tako vi ali).
  • Možnost dodatne obdelave zbranih podatkov s pomočjo vtičnikov in nalaganja.
  • Sposobnost cikliranja kampanj. Ko bodo rezultati prve naloge razčlenjevanja vneseni v drugo nalogo zbiranja podatkov. Več podrobnosti.

Kako se uporablja razčlenjevalnik WordPress?

Če ste ustvarili blog, vam čez nekaj časa postane jasno, da je za njegovo promocijo nenehno potrebna nova edinstvena vsebina. In postane leno, da sami pišete članke in ročno napolnite spletno mesto. Toda kje dobiti nove vsebine? Prej ali slej pride čas, ko se želite zateči k samodejnemu bloganju. Preprosto povedano, uporabite razčlenjevalnik, ki bo sam objavil informacije, ki jih potrebujemo. S to nalogo nam bo pomagal razčlenjevalnik vsebin za WordPress.

Vsa spletna mesta so bila kdaj ustvarjena iz nič. Če pa je namen vašega spletnega mesta zagotavljanje informacij, bo postalo zanimivo šele, ko bo količina informacij presegla določeno količino. Razčlenjevalnik blogov WordPress je odlična rešitev za to nalogo. Z njegovo pomočjo lahko v kratkem času dohitite konkurente in znatno razširite katalog informacij spletnega mesta. Razčlenjevalnik WordPress-a je mogoče implementirati kot graber za WordPress z določenega mesta.

Razčlenjevalnik blogov WordPress lahko pomaga pri številnih opravilih, tukaj je nekaj izmed njih:
- začetno polnjenje vira (razčlenjevalnik spletnega mesta za WordPress vam bo omogočil, da svoj blog v najkrajšem možnem času napolnite z informacijami iz nič do zahtevanega obsega);
- ustvarjanje samodejno izpolnjenega bloga (razčlenjevalnik WordPress bo lahko zagotovil redno samodejno posodabljanje vsebine spletnega mesta)
- objava vsebine "po urniku" (lahko načrtujete čas dodajanja objav na vaše spletno mesto)

Množična objava v WordPressu

Razčlenjevalnik WordPress, predstavljen v Datacolu, je dober primer, kako uporabiti razčlenjevalnik za množično objavljanje. Omogoča vam, da samodejno pridobite vsebino in jo objavite v svojem spletnem dnevniku. Proces razčlenjevanja WordPressa lahko razdelimo na več stopenj:

1) Postopek zbiranja vsebine. Razčlenjevalnik za WordPress zbira potrebne informacije za vsako objavo v spletnem dnevniku: naslov, vsebino (naloženo s slikami, ki se shranijo v vaš računalnik za nadaljnje nalaganje prek FTP na vaš strežnik), kategorijo, avtorja in povezavo, s katere so bili zbrani podatki ( URL).

2) Shranjevanje informacij, ki jih je zbral razčlenjevalnik za WordPress. Po razčlenjevanju se zbrani podatki shranijo v datoteke TXT (vsaka objava se shrani v ločeno besedilno datoteko), katerih imena so generirana v skladu z imenom objave.

3) Izvozi WordPress. Prav tako je mogoče neposredno izvoziti razčlenjene podatke v svoj blog WordPress. To naredi postopek polnjenja zelo hiter in odpravlja možnost človeške napake. Možnost izvoza v WordPress je zagotovljena v osnovni funkcionalnosti programa. V nastavitvah programa morate določiti parametre za povezavo z vašim spletnim dnevnikom in nastaviti podatke za izvoz (naslov, vsebina, kategorija itd.)

4) Obdelava informacij. Po želji lahko podatke, zbrane med postopkom razčlenjevanja WordPress-a, obdelamo (na primer podvržemo samodejnemu prevodu ali sinonimizaciji). Te funkcije se izvajajo s pomočjo vtičnikov.

Kako razčleniti spletno mesto na WordPressu?

V WordPressu ne morete samo objaviti razčlenjenih informacij, ampak jih lahko tudi razčlenite. Težava uporabe blogov WordPress nekoga drugega kot vira vsebine za svoje bloge se pojavlja precej pogosto. Razčlenjevalnik spletnega mesta WordPress vam bo pomagal rešiti to težavo. Algoritem dela razčlenjevalnika spletnega mesta WordPress je podoben zgoraj opisanemu.

Prednosti razčlenjevalnika spletnega mesta WordPress

Verjetno ste že prepričani, da vam bo razčlenjevalnik blogov WordPress pomagal, da ne boste porabili veliko časa in truda za ročno polnjenje svojega bloga. Zahvaljujoč temu ne morete samo avtomatizirati svojega dela, ampak tudi povečati njegovo učinkovitost. Lahko prenesete razčlenjevalnik za WordPress, ki je implementiran v Datacol

Preizkušanje razčlenjevalnika spletnega dnevnika

Če želite preizkusiti razčlenjevalnik bloga:

2. korak. Drevo akcije vsebuje kampanjo content-parsers / kolchaka-net.par. Izberite ga in kliknite gumb Predvajaj. Preden začnete, lahko uredite vhodne podatke. Tako lahko nastavite povezavo do spletnega dnevnika ali spletnih strani, s katerih boste razčlenili vsebino.

Korak 3. Počakajte, da se prikažejo rezultati razčlenjevalnika spletnega dnevnika. Ko se prikažejo rezultati, lahko razčlenitev prisilno ustavite (s klikom na gumb Ustavi).

kliknite na sliko za povečavo

Korak 4. Po koncu/prisilni zaustavitvi razčlenjevalnika v mapi Moji dokumenti, ki jo najdete besedilne datoteke(vsaka objava se shrani v ločeno datoteko), katere naslovi so generirani na podlagi naslovov objav:

kliknite na sliko za povečavo