STATISTIKY NÁVŠTĚVNOSTI NA INTERNETU
Jindřich Ekart
Snahou každého provozovatele internetových stránek je, aby jeho stránky pravidelně prohlíželo co nejvíce návštěvníků. Počet návštěvníků za určité období je totiž měřítkem úspěšnosti daného internetového serveru a pokud je na www server umisťována placená reklama, umožňují tyto statistiky vyčíslit inzerentům, kolik lidí jejich reklamu shlédlo. Od počtu shlédnutí reklamního prvku (reklamní proužek, reklamní ikona atd.) se také potom odvíjí jeho cena. U tištěného média, jako jsou noviny nebo časopisy, je měřítkem jeho oblíbenosti počet prodaných výtisků, případně počet vydaných výtisků – tzv. náklad. U internetových stránek je sledování oblíbenosti složitější. Používá se několik různých metod ke zjištění počtu návštěvníků internetových stránek a v tomto článku si některé z nich blíže představíme.
Návštěvníci sledovaných stránek, většinou jde o vstupní stránku serveru – tzv. homepage, si kromě obsahu “stahují” i tento přidaný kousek HTML kódu a tím se u specializovaného serveru generují údaje o návštěvnosti sledovaných stránek. Pak už lze sledovat rozsáhlou statistiku, kde se kromě počtu přístupů, i odkud na sledované stránky lidé přišli, jaký používají prohlížeč, jaký operační systém, jejich IP adresu, zobrazuje mnoho dalších užitečných údajů. To vše je zpracované v přehledných tabulkách a grafech. Tyto statistiky jsou většinou veřejně přístupné, jsou tříděny podle tématických oblastí stránek a řazeny do “žebříčků” podle počtu návštěvníku za určité období (den, měsíc, rok). I tomu, kdo pouze hledá na internetu nějakou informaci, může podobný žebříček podstatně ulehčit práci. Oproti jiným katalogům máme tu výhodu, že se hned dozvíte, jak je nalezená stránka navštěvovaná, což může být určitým signálem o její kvalitě.
Příkladem podobné služby na českém internetu je server NAVRCHOLU.CZ, který naleznete na adrese http://navrcholu.cz. Internetový server SILVARIUMPŘÍRODA A ŽIVOTNÍ PROSTŘEDÍ (internetová adresa: http://web.navrcholu.cz/den/priroda_a_zivotni_prostredi/). je nyní v této službě také registrován, a naleznete jej v kategorii
Dalším známým serverem na českém internetu, který měří návštěvnost, je server TOPLIST.CZ na adrese www.toplist.cz.
Další metodou, která je průkaznější než předešlá, protože pracuje s podrobnějšími údaji, je metoda analýzy tzv. log souborů. Každý web server, což je vlastně systém, jenž poskytuje vyžádané stránky návštěvníkovi konkrétního místa na internetu, generuje standardizovaný žurnálový výstup (tzv. log soubor), který zaznamenává veškeré požadavky na stránky, obrázky, které návštěvníci serveru vyžádali (vlastně kolik a jakých shlédli stránek, obrázků a pod.).
Pro analýzu log souborů se používají specializované programy, které všechny údaje průběžně vyhodnocují a generují přehledné tabulky a grafy, které se dají zobrazit opět jako internetová stránka (HTML kód).
Internetový server SILVARIUM má své stránky umístěny na serverech společnosti KPN QWEST. Návštěvnost všech stránky umístěných na těchto serverech je každý den analyzována a zobrazena na veřejně přístupném místě. Například návštěvnost serveru SILVARIUM je zobrazena na adrese http://infor.eunet.cz/www/silvar/ v přehledných tabulkách a nejdůležitější informace jsou zobrazeny graficky.
Jednou z nejprůkaznějších metod zjištění návštěvnosti je nezávislý audit návštěvnosti internetových serverů. Tato služba je zpoplatněna a využívají ji poskytovatelé internetového obsahu, kteří potřebují kvůli svým inzerentům doložit vyhodnocení provozu nezávislou stranou, čímž je zaručena vyšší důvěryhodnost dat (i serveru a provozovatele).
Pro zpracování nezávislého jsou nutné dvě zásadní sady informací. Log soubor (jako u předchozí metody) a vstupní informace o nastavení serveru. Rozdíl oproti předchozí metodě je v tom, že audit provádí nezávislý subjekt přesně definovanou metodikou. Log soubor provozovatel předá nezávislému subjektu, který provede analýzu vlastním softwarem, přesně definovanou metodikou (tzn. u všech stejně). Výsledky této analýzy-auditu jsou poskytnuty provozovateli, který je dále může (ale nemusí) užívat nebo zveřejňovat.
Příkladem této služby je iAudit, kterou nalezneme na adrese http://audit.dcci.cz/. Zde si nechávají ověřovat svou návštěvnost nejnavštěvovanější servery v ČR jako například SEZNAM, ATLAS, QUICK, REDBOX atd.
Na závěr si objasníme základní pojmy, které se používají při vyhodnocení návštěvnosti internetových serverů:
Hity (hits) – každý požadavek (dotaz) na server. Požadavek může být na html stránku, grafický obrázek, audio soubor, CGI skript, atd. Počet hitů reprezentuje celkové množství požadavků, které bylo učiněno na server během specifikované časové periody.
Soubory (files) – některé požadavky na server, jejímž výsledkem je zaslání souboru – html stránky nebo grafického obrázku na klienta (návštěvníka stránky). Vztah mezi hitem a souborem může být interpretován jako “příchozí požadavek” a “odeslaná odpověď”.
Počet shlédnutých stránek (pages, pageviews) – obecně všechny stažené HTML dokumenty nebo stránky generované jako HTML dokumenty. Nezahrnuje soubory jako grafický obrázek, audio klip atd. Tyto dokumenty mají většinou příponu htm, html, cgi, phtml, php3, pl atd. Někdy se také označuje jako tzv. “čisté hity”.
Počet unikátních počítačů (sites, hosts) – každý požadavek na server, pocházející z tzv. unikátní IP adresy (unique site) . Toto číslo reprezentuje kolik unikátních IP adres učinilo požadavek na server během specifikované časové periody. Toto číslo neznamená počet individuálních uživatelů (lidí), kteří server navštívili. Je to proto, že za jednou IP adresou může být schována celá lokální síť mnoha počítačů. Toto číslo je také zkresleno používáním kešovacích mechanismů v prohlížečích a na proxy serverech poskytovatelů
Počet návštěv – přístupů (visits) – kdykoliv je učiněn požadavek na server z určité dané IP adresy (site), po definovaném časovém úseku po předešlém požadavku, je tento požadavek započítán jako návštěva (visit). Tento definovaný časový úsek se nazývá “visit timeout” a jeho default hodnota bývá 30 minut (ale může být změněna). Vzdálené přirovnání by mohlo být, kolikrát bylo tiskové medium "vzato do ruky". Toto číslo je vždy vyšší než počet uživatelů média. Jako visits se započítávají pouze požadavky na server definované jako požadavky na stránky (PageType reguests).
Session - unikátní návštěvník podle cookies. Pokud přistoupíte na stránku 10x z jednoho browseru (prohlížeče), je započtena pouze jedna 'session' (ale 10 přístupů).
The KBytes (kilobytes) – množství všech dat v KB, které bylo zasláno serverem během specifikované časové periody k návštěvníkům. (Pozn: 1 kilobyte je 1024 bytes, ne 1000)
Jindřich Ekart, 17.června 2001
Adresa redakce SILVARIUM:
Redakce SILVARIUM
Smetanova 891, 755 01 Vsetín
Tel.: 0657 / 619 373, fax: 0657 / 619 374
www.silvarium.cz, Tato e-mailová adresa je chráněna před spamboty. Pro její zobrazení musíte mít povolen Javascript.