Starší komentáře ke článku: Statistika přístupů v PHP - počet unikátních návštěvníků
Zpět na článek | Úvodní stránka Interval.cz
Datum vložení: 13.12.2003 2:01:12
spoustu veci bych z access vyhodil a dal je treba do tabulky hosts aby byli jen jednou a znovu se neopakovali a nechal tam jen id, access_date a path
Datum vložení: 13.12.2003 11:05:56
Ano, i takto by to slo resit. Zrejme by se celkem "jednoduse" daly pridat i dalsi funkce - napr. prumerny pocet stranek na jednu navstevu, stranky, kde navstevnici konci svoji navstevu, atp.
Usestrilo by se i nejake misto (nicmene relativne malo), ale na druhe strane by se zkomlikovalo a zpomalilo zpracovani dat a predevsim jejich ukladani, ktere by mohlo znacne zatezovat server.
Zalezi tedy na tom, cemu davate prednost - usestrit misto a vice zatizit server (vase reseni) nebo vice mista pri minimalni zatezi (ukladat vse a data zpracovat az pozdeji) eventuelne neco mezi - tj. treba moje reseni.
Datum vložení: 13.12.2003 13:03:19
Jestlize chcete delat statistiky, je vzdycky lepsi mit VIC dat ktera nevyuzijete nez min ktera vam staci dnes. Za mesic muzete chtit neco jineho a pak se to muze hodit.
Datum vložení: 13.12.2003 13:21:50
Jestli jsem to dobře pochopil, pak DFly navrhoval spíše zavést samostatnou tabulku na návštěvníky a do hlavní tabulky access místo všech atributů dát jen odkaz na konkrétního návštěvníka. Na tom nevidím nic špatného, z metodického hlediska by to bylo určitě vhodnější, a na rozdíl od autora článku nejsem ani tak moc přesvědčen, že by to zvyšovalo zátěž serveru tak enormně, aby to převážilo pozitiva takového řešení.
Datum vložení: 14.12.2003 15:12:19
Ale pokud bude tech navstevniku nekolik (desitek) tisic, pak pri kazdem pristupu budu muset zjistit, zda tohoto navstevnika v hosts mam nebo ne, coz uz muze byt znat. Vhodne resenymi indexy by se to asi dalo optimalizovat, ale indexy taky nejake to misto spotrebuji, takze tezko rict, ktere reseni je lepsi.
Datum vložení: 14.12.2003 17:10:55
Při tom druhém přístupu mám ale zase o to náročnější hledání ve statistice, protože provádím podstatně složitější 'group by' klauzuli. Nemluvě o tom, že se tím nafukuje databáze. Hodně bude záležet na tom, jestli mám velké množství víceméně náhodných návštěv nebo menší počet <I>štamgastů</I>. Takže v praxi by bylo potřeba odzkoušet obě varianty na reálných datech.
Datum vložení: 14.12.2003 21:42:17
Obecný trend je snižujicí se cena a zároveň zvyšující se výkon železa. Naopak cena lidské práce při nezvětšeném výkonu stoupá.
Má tedy smysl platit programátorovi za pár ušetřených bajtů (byť v měřítku měsíců a let se těch pár bajtů projeví jako několik <I>Mega</I>bajtů)?
Například ip adresu by také šlo zapisovat v hexa tvaru.
Namísto 255.255.255.255 (délka 15) napsat ffffffff (délka 8).
Pro všechny možné i nemožné ip adresy mi vychází úctyhodný rozdíl v objemu spotřebovaných dat pro sloupec ip.
Jenomže uvědomím-li si, že pokud by mi skutečně přišli návštěvníci ze všech ip adres tedy $00000000 až $ffffffff, pak hosting, poskytující tak velkou databázi stejně nezaplatím.
Čili - optimalizace ano, ale jen pokud si na sebe vydělá.
/* R.Palát; <a href='http://www.najedno.cz' target='_blank'>http://www.najedno.cz</a> */
Datum vložení: 15.12.2003 20:41:34
2 DFly:
Skor sa priklanam k tomu povodnemu navrhu DB, pretoze suhlasim, ze v pripade, ze mame 10.000 navstevnikov, je omnoho vyhodnejsi jeden insert do table access, ako select v 10.000 zaznamoch table hosts a nasledny insert do access. Je sice pravda, ze naroky na vykon budu o to vacsie pri analyze dat, ale myslim, ze pokial budeme mat denne napr. 10.000 sessions, je to stale vyhodnejsie.
2 MK:
<I>"Zrejme by se celkem "jednoduse" daly pridat i dalsi funkce - napr. prumerny pocet stranek na jednu navstevu, stranky, kde navstevnici konci svoji navstevu, atp."</I>
Myslim, ze tieto funkcie by sa dali aplikovat i na povodne riesenie, tj. iba table access, avsak boli by narocnejsie na programovanie. Alebo sa mylim?
Do tabulky access by som vsak este zaradil jedno pole, napr. visitor, kde by bol jedinecny identifikator jednotlivych navstevnikov, ktori by sa identifikovali pomocou cookie, resp. kombinaciou cookie a IP. Tym by sa myslim vyrazne zvacsila funkcionalita a presnost, nakolko identifikovanie navstevnikov iba za pomoci IP je IMHO nedostatocne a nepresne (ip farmy, proxyny,...).
A tiez je pravda, ze napr. i Apache loguje pristupy podobne.
BTW: Podla pravidiel IFABC, co je urcity nepisany standard inet monitorov, sa za navstevu chape interval vacsi ako 30 min. medzi jednotlivymi pristupmi.
d0t
_____________________
<a href='http://www.4dsolutions.sk' target='_blank'>http://www.4dsolutions.sk</a>
Datum vložení: 13.12.2003 16:33:50
Zajimalo by mne, v cem je udelane to schema databaze. Kdyz delam slozitejsi databazi mam problem s prehledem relaci mezi jednotlivymi tabulkami. Dobre je to resene v Accesu, tam je vse krasne prehledne. V MySql nejaky podobny nastroj postradam. Zatim si to vzdycky namaluju v nejakem grafickem programu, ale to je takove kostrbate reseni.
Mate nejaky dobry tip ?
Datum vložení: 14.12.2003 15:39:20
Dostal jsem zajimavy tip od znameho na cesky nastroj CASE Studio, ktery opravdu podobne veci umi. Podporuje radu databazi vcetne MySQL a umi udelat pekny prehledny "report" s rozpracovanym navrhem struktury.
(Teprve se do detailnejsiho zkoumani nastroje poustim.)
Odkaz: <a href='http://www.casestudio.com/csy/products.aspx' target='_blank'>http://www.casestudio.com/csy/products.aspx</a>
Myslim, ze demoverze je omezena poctem entit a cena za plnou verzi s prihlednutim k moznostem nastroje a cene podobnych systemu neni opravdu vysoka.
Kazdopadne me samotneho by take zajimalo v cem je udelany diagram v clanku. Snad se autor podeli... ;-)
Datum vložení: 14.12.2003 15:42:17
Toto je delane taky "rucne". Zadny tip bohuzel nemam :-)
Datum vložení: 14.12.2003 22:34:02
<a href='http://www.fabforce.net/' target='_blank'>http://www.fabforce.net/</a> - zdarma hlavne pre MySQL , alebo uz spominane case studio.
Datum vložení: 17.12.2003 20:29:38
Pouzivam DeZign od Datanamic Solutions. Vrele doporucuju.
Datum vložení: 28.1.2004 19:39:36
Ja posledni dobou pouzivam na vytvareni schema databaze primo PHPMyAdmina.
Staci pridat nejaky tabulky do databaze (podle manualu) a pak uz jenom vytvorit relace mezi tabulkami a rozmisteni jednotlivych tabulek.
Datum vložení: 1.2.2004 2:14:18
Mohl by si to vice specifikovat?
Hledal jsem to a nic jsem nenasel.
Vlaskal
Datum vložení: 15.12.2003 12:16:00
Zdarvicko, nedalo by sa napisat clanok aj bez pouzitia databazy ?
dakujem.
Datum vložení: 15.12.2003 20:38:40
Ano jde to udělat bez databází a ukládat data do souborů, ale ve skutečnosti to dělá víc škody než užitku. Prostě se to nevyplatí.
Datum vložení: 17.12.2003 12:34:06
Podle mých zkušeností je řešení bez databáze pro menší (návštěvností) weby bez problémů funkční. Požadované údaje se ukládají do txt soubrů (vpodstatě logů) a nad nimi pak probíhá analýza. Ta je možná buď přes skripty přímo na webu, nebo offline po stažení logů pomocí kontingenčních tabulek a grafů v Excelu.
Je tedy pravda, že některé parametry se vyhodnocují obtížněji, ale je to podle mne otázka potřeb a požadavků, takže bych toto řešení apriori neodsuzoval. Spoutě webů může plně vyhovovat a naopak db pro ně mohou být problémem.
Datum vložení: 17.12.2003 19:45:26
A jak řešíte kolize při současném zápisu dvou instancí do téhož souboru? Nebo je neřešíte a doufáte, že se vám vyhnou nebo že si jich nikdo nevšimne?
Datum vložení: 20.12.2003 18:42:21
Zdravíčko, a nešlo by nepoužívať vulgarizmy, navyše priamo v mene?
Datum vložení: 16.12.2003 9:25:20
Jedná se ho znovupublikování zcela stejného seriálu nebo bude skript vylepšen, upraven, rozšířen např. na základě ohlasů z fóra (z min. vydání)???
Datum vložení: 16.12.2003 9:56:06
Jaký smysl by mělo přiřadit článku nové datum a nechat ho v původní podobě?
Datum vložení: 17.12.2003 21:18:44
mate-li pravdu a jedna se o rozsireni/prepracovani clanku potazmo skriptu (ikdyz radsi bych to slysel primo od autora), pak bych VELMI UVITAL kdyby jsem se mohl dozvedet z clanku (nebo alespon fora) v cem bude novy skript aktualizovan... pokud nekdo cetl, pouzival ci pouziva tento skript (v ten puv verzi z roku 2002), byla by to pro nej tato informace dost podstatna...
..btw po zbeznem prohlednuti 1. dilu
Datum vložení: 1.1.2004 20:14:36
Jeste neni uplne definitivni, co vse se objevi v aktualizovane verzi, nicmene vylepseni a jednu novou funkci prinese jiz pristi dil tykajici se detekce prohlizecu.
Datum vložení: 12.1.2004 11:30:06
Daly by se zde uvedené zdrojové kódy někde stáhnout. Mám na mysli ke všem článkům "Statistika přístupů v PHP" ?? Děkuji
Datum vložení: 12.1.2004 18:41:04
V poslednim (12.) clanku. Aktualizovane budou ke stazeni az s posledni aktualizaci.
Datum vložení: 16.1.2004 16:51:22
V tejto suvislosti by ma zaujimalo, v akych casovych intervaloch budu uverejnovane jednotlive clanky. Vdaka
Datum vložení: 18.1.2004 21:07:26
v cem je delanej ten navrh databaze, prezentovany v tomto clanku tim 60kb obrazkem?
Datum vložení: 19.1.2004 18:39:44
<a href='http://interval.cz/discussion-read.asp?disc=1155&content=all#story21887' target='_blank'>http://interval.cz/discussion-read.asp?disc=1155&content=all#story21887</a>
Datum vložení: 23.5.2004 18:01:19
Asi mi neco uniklo, ale moc nerozumim nasledujicimu:
<I>"... Každý návštěvník však může za den vytvořit pouze jeden visit."</I> v.
<I>"... uživatel s danou IP adresou přistoupil před časovým úsekem kratším než 20 minut a tudíž se nejedná o visit. V opačném případě se jedná o visit ($visit = 1)". </I>
Mam to chapat tak, ze prvni tvrzeni neplati? Pri vypnutych cookies je kazda navsteva ze stejne IP adresy po vice nez 20-ti minutach chapana jako visit?
Datum vložení: 23.5.2004 23:32:35
Ta prvni veta popisuje idealni stav, ktery se vsak nikdy neda zarucit.
"<I>Ani tato metoda však bohužel neurčí přesně počet unikátních návštěvníků za den. Může se stát, že na stránkách se současně pohybuje několik uživatelů se stejnou IP adresou, kteří mají vypnuté cookies - bude započítán pouze jeden visit. Naopak uživatel s vypnutými cookies může v průběhu dne navštívit stránky vícekrát a vytvořit tak více visits.</I>"
Datum vložení: 11.12.2004 21:10:21
Ahoj,
jakožto začátečník amatér mám začátečnickou otázku. Pochopil jsem tenhle článek tak, že uvedený zdrojový kód patří do tří souborů a že časem další přibudou. Dá se ale už tato ukázka reálně použít, tj. počátá už nebo bude třeba ještě něco doplňovat? A jestli počítá, jak vložit odkaz na stránku, jejíž návštěvnost se sleduje?
Díky
Datum vložení: 23.12.2004 8:35:52
Správný postup je, že si nejprve všechno přečteš a pak se ptáš :-)
Mrkni na konec (zatím?) posledního dílu - <a href='http://interval.cz/__redirect/redirect.asp?what=interval_discussion&url=http://interval.cz/clanek.asp?article=1497' target='_blank'>http://interval.cz/clanek.asp?article=1497</a> , je tam odkaz na stažení zatím platné verze a "návod k obsluze".
Datum vložení: 27.12.2004 15:43:35
Zdravim. MySql moc neovladam, preto by som chcel, ci by niekto nebol ochotny spravit to tak, aby sa to ukladalo do txt suborov. zatial dik
Datum vložení: 3.2.2006 4:38:22
Myslim ze by k vetsi prenosti prispelo i porovnavani barevne hloubky, rozliseni a browseru. Browser je diskutabilni, ale pochubuji ze by si nekdo menil rozliseni a color. A podle statistiky vidim ze je hodne rozliseni co lidi pouzivaj. Co myslite?