E-posbemarking en e-posbemarkingsautomatiseringBemarkingsinstrumente

Hoe u 'n groot webwerf kan deurkruip en data kan uithaal met behulp van Screaming Frog se SEO Spider

Ons help tans verskeie kliënte met Marketo-migrasies. Aangesien groot maatskappye ondernemingsoplossings soos hierdie gebruik, is dit soos 'n spinnerak wat homself oor jare in prosesse en platforms verweef … tot die punt dat maatskappye nie eens bewus is van elke raakpunt nie.

Met 'n ondernemingsbemarkingsautomatiseringsplatform soos Marketo, is vorms die toegangspunt van data op alle webwerwe en bestemmingsbladsye. Ondernemings het dikwels duisende bladsye en honderde vorms op hul webwerwe wat geïdentifiseer moet word vir opdatering.

'N Goeie hulpmiddel hiervoor is Screaming Frog se SEO Spider… miskien die gewildste platform in die SEO mark vir die deurkruip, ouditering en onttrekking van data vanaf 'n webwerf. Die platform is ryk aan kenmerke en bied honderde opsies vir feitlik elke taak wat u benodig. Die kenmerke strek egter veel verder as die optimalisering vir soektog, met een ongelooflik nuttige kenmerk om data van jou werf af te onttrek terwyl dit deurkruis word.

Screaming Frog SEO Spider: kruip en uittreksel

'N Belangrike kenmerk van Screaming Frog SEO Spider is dat u persoonlike uittreksels op grond van regex, XPath, of CSSPath besonderhede. Dit is baie nuttig omdat ons die kliënt se webwerwe wil deurkruip en die MunchkinID- en FormId-waardes vanaf bladsye moet hersien en vaslê.

Maak oop met die gereedskap Konfigurasie> Pasgemaak> Onttrekking om elemente te identifiseer wat u wil onttrek.

skreeuwende persoonlike ontginning

Die onttrekkingskerm maak feitlik onbeperkte data-insameling moontlik:

Screaming Frog SEO Spider Extraction Reëls

Regex, XPath en CSSPath Extraction

Vir die MunchkinID is die identifiseerder geleë in die vormskrif wat binne die bladsy is:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Ons pas dan 'n Regex reël om die ID vas te vang uit die script-tag wat op die bladsy ingevoeg is:

Regex: ["']id["']: *["'](.*?)["']

Vir die vorm-ID is die data in 'n invoerplaatjie binne die Marketo-vorm:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Ons pas 'n XPath-reël om die ID vas te vang uit die vorm wat op die bladsy ingevoeg is. Die XPath-navraag soek na 'n vorm met 'n invoer met die naam van gedug, dan stoor die uittreksel die waarde:

XPath: //form/input[@name="formid"]/@value

Onttrek Inline Style Tags

Ons help 'n kliënt op die oomblik om 'n webwerf skoon te maak waar hulle inlynstyle op die Elementor-inprop gebruik het om feitlik elke element met 'n bladsy aan te pas. Om te identifiseer waar inlynstyle gebruik is, het ons die webwerf geskrap met 'n aantal RegEx-reëls vir persoonlike onttrekking:

  • Span inlyn styl:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Ankermerker inlynstyl:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Div Tag Inline Style:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Opskrifmerker inlynstyl:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"

Sluit subdomeine in jou deurkruip uit

At Martech Zone, bedien ons die webwerf in verskeie tale by verskillende subdomeine. Dit is nie nodig om hierdie vertalings te deurkruip nie, aangesien al die bates en inligting op die kernwerf gebaseer is. As gevolg hiervan het ons die Uitsluitlys-konfigurasie geaktiveer en die volgende reël bygevoeg:

.*\.martech.zone

Jy kan dit ook gebruik om die deurkruip van onnodige paaie soos etikette oor te slaan deur by te voeg:

martech.zone/tag/.*

Die platform het selfs 'n goeie metode om sommige te toets URL's teen die reëls om te verseker dat dit behoorlik werk voordat jy jou werf deurkruis.

Skreeuende Padda SEO Spider Javascript Rendering

Nog 'n goeie opsie van Screaming Frog is dat jy nie beperk is tot die HTML op die bladsy kan jy enige JavaScript lewer wat vorms binne jou werf gaan invoeg. Binne Konfigurasie> Spinnekop, kan u na die tabblad Rendering gaan en dit aktiveer.

Skreeuende Padda SEO Spider Javascript Rendering

Dit neem natuurlik 'n bietjie langer om die webwerf te deursoek, maar u kry vorms wat deur JavaScript aan die kliënt se kant weergegee word, sowel as vorms wat op die bedienerskant ingevoeg word.

Alhoewel dit 'n baie spesifieke toepassing is, is dit ongelooflik nuttig as u met groot webwerwe werk. U sal absoluut wil kontroleer waar u vorms regdeur die webwerf ingebed is.

Laai Screaming Frog SEO Spider af

Openbaarmaking: Martech Zone gebruik sy geaffilieerde skakels in hierdie artikel.

Douglas Karr

Douglas Karr is die stigter van die Martech Zone en 'n erkende kenner van digitale transformasie. Douglas het gehelp om verskeie suksesvolle MarTech-opstartondernemings te begin, het gehelp met die omsigtigheidsondersoek van meer as $5 miljard in Martech-verkrygings en -beleggings, en gaan voort om sy eie platforms en dienste bekend te stel. Hy is 'n medestigter van Highbridge, 'n konsultasiefirma vir digitale transformasie. Douglas is ook 'n gepubliseerde skrywer van 'n Dummie-gids en 'n besigheidsleierskapboek.

verwante Artikels

Wat dink jy?

Hierdie webwerf gebruik Akismet om spam te verminder. Leer hoe jou opmerking verwerk is.