websas.hu  
Üdvözöljük a RuNet - érdekességek az orosz internetrõl portálon
  RuNet - érdekességek az orosz internetrõl - az átjáró  
 
 Menü
· Kezdőlap
· Cikkarchívum
· Fotóalbumok
· Hírlevél
· Kereső
· Rovatok
· Személyes beállítások
· Top 10
· Vendégkönyv


 Bűvésztitkok, szemfényvesztés

Bűvésztitkok, szemfényvesztés

·Amazon szertartás
·A leskelődő
·A kacsa
·A repülő fotel
·A lézer
·Megjelenés a semmiből
·A Tűztornádó titkai
·A Barkley-ház. (Ismeretlen erők. 1995)
·Lerajzolt kártya. (Zuhanás a Niagara vízesésbe. 1990)


 Különvélemény

Különvélemény

·ATM, add vissza a pénzem!
·Az élet biztosan nem a Földön keletkezett. Első rész
·Moore törvénye és a műszaki fejlődés
·Az internet-függőség a drogfüggőséghez vagy az alkoholizmushoz hasonlítható 2.
·Hogyan tüntessük el a nyomokat, avagy van-e okunk a paranoiára? 3.
·Microsoft pro és kontra
·Az internet-függőség a drogfüggőséghez vagy az alkoholizmushoz hasonlítható 1.
·Hogyan tüntessük el a nyomokat, avagy van-e okunk a paranoiára? 2.
·Hogyan tüntessük el a nyomokat, avagy van-e okunk a paranoiára? 1.


 Civilizációnk kultúrájának forrásainál

Civilizációnk kultúrájának forrásainál

·A három grácia
·Feljutni a Parnasszusra
·Mint a százfejű hidra
·Atlaszként tartja vállán...
·Elmúlt az aranykor...
·A Szfinx rejtelmes mosolya
·Pandóra szelencéje
·Tantaloszi kínok
·Sziszifuszi erőfeszítések


 Programosdi

Programosdi

·Otthoni PC mint mini WAP-szerver
·A kis archivátor nagy története
·Spamvadász
·Hogyan szerezzünk könyvet az internetről. Gyakorlati útmutató
·Ha gond van az internet-kapcsolattal
·Apró trükkök 2
·Az operációs rendszerünk karbantartása II
·HDD-élet a halál után
·Az operációs rendszerünk karbantartása I


 Fémdobozba zárva

Fémdobozba zárva

·A szoftverek védelme II.
·A szoftverek védelme I.
·Távirányítózunk
·Minden, amit a beépített hangról tudni érdemes
·Az alapok alapja. A BIOS. II
·Az alapok alapja. A BIOS. I
·A videóadapter. A legfontosabb kérdések és a működési elv
·Hogyan válasszuk ki a számítógépet
·A virtuális valóság eszközei


 WWW

WWW

·YouTube: trükkök, melyeket eddig nem ismertünk
·e-Business: kérdések és válaszok IV.
·e-Business: kérdések és válaszok III.
·e-Business: kérdések és válaszok II.
·Albert Einsteinnek web-oldalt készítettek
·e-Business: kérdések és válaszok I.
·Könyvtár helyett Internet
·A láthatatlan front harcosai, avagy a META tag-ek
·Hogyan regisztráljuk helyesen a web oldalunkat?


 Világháló

Világháló

·Csalók az interneten 1.
·Az internet legújabb története: Yahoo!
·Az internet legújabb története: AskJeeves, a válasz
·Végezzünk ''régészeti ásatásokat'' az interneten, avagy vissza a múltba
·Modern korunk új jelensége: a cyber-zsarolás
·On-line tobacco: két probléma a cigarettával az interneten
·Az AOL a spammerekkel pereskedik
·Ingyenes posta a .COM zónán belül
·Internet 2003: milyen lesz a Háló az idén?


 Ilyen is megesik

Ilyen is megesik

·Porszívó orosz módra...
·Mi végignézzük, hogyan halsz meg


 Kereső szolgáltatások

Keresok

Magyar nyelvű keresők

 · Ahova
 · Altapuli
 · Altavizsla
 · Góliát
 · Heuréka
 · Hudir
 · Index
 · Kapu
 · Maci
 · Megaport
 · Net.hu


Angol nyelvű keresők

 · Google
 · Yahoo!
 · AltaVista
 · Lycos
 · AskJeeves
 · DirectHit
 · Excite
 · AllTheWeb
 · Go
 · GoTo
 · HotBot-Lycos
 · Inktomi
 · LookSmart
 · Search MSN
 · Search Netscape
 · NorthernLight
 · Dmoz
 · RealNames
 · Snap
 · Webcrawler
 · Metacrawler
 · MetaGopher



Orosz nyelvű keresők

 · Aport
 · Yandex
 · Rambler
 · AtRus
 · Ya.ru
 · List.ru



FTP keresők

 · Indexer.ru
 · FTP Rambler
 · FTP Search
 · Filez


 Hányan olvasnak bennünket
Jelenleg, 16 vendég és 0 regisztrált felhasználó olvas bennünket.

Jelenleg névtelen látogató vagy. Ingyenesen regisztrálhatod magad, ide kattintva


3927606 találat
2003 áprilisa óta

0.033 sec


 Végezzünk ''régészeti ásatásokat'' az interneten, avagy vissza a múltba
Világháló Akarják látni saját szemükkel, hogy milyen is volt az internet tegnap, a múlt héten, esetleg 1996-ban? Semmi gond. Ez teljesen reális kívánság. Nem hiszik? Akkor olvassák el ezt a cikket, amely a Waybach Machine-ról, az internet archívumáról szól. Már 1996 óta archiválja az összes hozzáférhető web-dokumentumot, s mára már mintegy 10 milliárd oldal található ebben az archívumban, talán az ön web-oldala is.

Internet-archívum a következő generációk számára

Az internet tulajdonképpen olyan, mint a futóhomok. A maga változatosságában és szabadságában talán csak az emberi közérzethez hasonlítható, fejlődésének üteme pedig olyan, mint azoké a mikroorganizmusoké, amelyek a számukra kedvező környezetben találhatók. Nagy, szabad és nem csupán bizonyos személyek számára fontos adatok tárolására szolgál, hanem dinamikus tükörképe mindazon emberek közérzetének, akik a monitorok előtt ülnek és létrehozzák magát az internetet. Oldalról oldalra, bájtról bájtra.

Megtalálhatjuk benne életünk egy részét, a fontosabbakat és a kevésbé fontosakat egyaránt. Mindezek ellenére azonban esély van arra, hogy életünknek ez a része nyom nélkül eltűnhet a múlt homályában. Statisztikai adatok szerint egy web-dokumentum átlagos élettartama mintegy 100 nap, ezek után a dokumentum vagy megváltozik, vagy egész egyszerűen törlődik. Ugyanezen statisztikai adatok szerint egy site átlagos élettartama 19 hónap. Ha a projekt nem hordoz magában fontos információkat, s a szerzői nem veszik a fáradságot és nem mentik meg azt valahol "emlékül", akkor egész egyszerűen eltűnik. Mindörökre eltűnik. Bele kell-e ebbe törődnünk?

Bruste Kahl, a Waybach Machine megalkotója úgy vélekedik, hogy ebbe semmiképpen sem szabad beletörődnünk. Ezért immár több mint 7 éve, 1995 óta, az Internet Archive összegyűjti egy adatbázisba és elmenti az összes hozzáférhető World Wide Web dokumentumot, beleértve a grafikákat is. Az adatbázis mérete már most lenyűgöző: több mint 10 milliárd oldal van elmentve, naponta mintegy 250 Gbájt információval nő az adatbázis, havonta több mint 12 terabájt információ érkezik ebbe az archívumba. A Waybach Machine az Alexa Internet cég leányvállalata, amelyik egy keresőrendszert üzemeltet, s a kereső pókjai szintén részt vesznek az archívumba bekerülő adatok gyűjtésében (pókok, spiderek stb. - olyan programok, melyek a keresőrendszerek alkotóelemei, mint pl. a Yandex, Google stb.), és amelyek az utalások (linkek) mentén mozogva a további indexáció céljából olvassák a web-oldalakat). Az internet-archívum nyilvánosan 2001 októbere óta érhető el.

Ide nekem az időgépet!

Ahhoz, hogy megbizonyosodjunk mindarról, amiről eddig szó volt, s egy sajátságos időutazást hajtsunk végre, elegendő mindössze a site nyitóoldalán megadnunk az általunk keresett site tartalmát. Sajnos, a Waybach Machine jelenleg még nem képes arra, hogy a web-oldal tartalma alapján végezze a keresést, mint más keresőrendszerek (pl. Yandex). Ezért ahhoz, hogy a megfelelő oldalra jussunk, tudnunk kell a konkrét URL-t, vagy legalábbis a site címét.

Számomra például rendkívül érdekes volt az, hogy miként nézett ki néhány évvel korábban a Computerra.ru. Hogy ezt a kíváncsiságomat kielégítsem, a keresőbe beírtam a www.computerra.ru címet, majd megnyomtam a "Take me back" gombot. Ennek a keresésnek az eredményeként, egy olyan oldalt kaptam, amelyik hét oszlopot tartalmaz, melyek különböző éveknek felelnek meg, 1996-tól 2002-ig. Minden oszlop dátumok listáját tartalmazza, melyek utalások különböző archívumokra. 1996 és 1997 között nincsenek adatok. A legrégebbi oldal, ami itt megtalálható volt, az 1998. december 12-i. Az 1999-es oszlop két utalást tartalmaz, melyek mindegyike valamilyen év elejei oldalt jelöl.

2000-ben már 14, 2001-ben pedig 28 utalás található az oldalon. 2000-től az archívum frissítése januárban kezdődött, és viszonylag rendszeresen, havonta 5-7 alkalommal elvégezték ezt a megújítást. Majd ezek után ez a folytonosság megszakadt. A 2002-es oszlop üres. Az utalások többségének végén a "*" jel található. Ez azt jelenti, hogy az oldal változott, és különbözik a legutóbbi archívumban található másolattól (nagyon érdekes, hogy néhány utalás, annak ellenére, hogy az oldal folyamatosan megújult, nincs "*"-gal jelölve. Ez az 1999 és 2000 augusztusa közötti periódus. Ez talán azzal magyarázható, hogy megváltoztak az anyagok feldolgozását szolgáló algoritmusok).

Kiválasztjuk az archívumban található legkorábbi utalást (1998. december 12). Töltődik az oldal. Az igazság az, hogy nálam nem minden kép töltődött le azonnal. Voltak olyan képek, melyek csak többszöri újralekérés után jelentek meg. Egy bizonyos idő elteltével egy érdekes részletre leszünk figyelmesek. Az oldal felső részén egy információs ablak található, melyben az Orosz Nemzeti Bank 1999. november 26-ra érvényes valutaárfolyamát olvashatjuk. Vagyis ez nem is 1998! Lehet, hogy ez is a rendszer hibás feldolgozási és rendszerezési algoritmusával van összefüggésben. Mindezek ellenére az oldal nagyon érdekes: régi külalak, egy Pentium III reklám, a fő oldalon pedig ilyen címek olvashatóak: "A Microsoft piacra dobja a Windows Millennium Beta 2-t", "Háború Koszovóban", "A 750 MHz-es Athlon már hétfőtől megvásárolható " stb.

Meg kell jegyeznem még néhány fontos részletet. Először is, minden cím http://web.archive.org/-gal kezdődik. Utána következik a fejezet neve ("web/"), majd számok egész sora, és csak ezt követően olvashatjuk magának az oldalnak a címét. Ilyen például a korábban említett oldal.

A számok sorozata korántsem véletlen. Ha alaposan megfigyeljük, akkor észrevehetjük, hogy a pontos dátumot adják "év - hónap - nap - óra - perc - másodperc" formátumban. Amint látjuk, ez az oldal valóban nem 1998-as, hanem 1999-es, pontosabban pedig 1999. november 28-án, 08:33:14 órakor lett regisztrálva. Egyébként ezt a szintaxist használhatjuk közvetlenül a keresés során is. Nem kell feltétlenül másodpercre pontosan tudnunk a regisztráció dátumát. Erre a célra használhatjuk a rövidített dátumot is. Így például a http:///2000/http://www.mysite.com szintaxis a 2000. július 1-jéhez legközelebbi dátumnak megfelelő oldalt fogja megjeleníteni. A ttp:///200010/http://www.mysite.com szintaxis eredményeként pedig olyan oldalt kapunk, melynek a dátuma legközelebb esik október 15.-éhez. Annak érdekében, hogy a legfrissebb archívumot tudjuk megtekinteni, a http:///http://www.mysite.com szintaxist kell alkalmazni.

Másfajta lehetőségeket kínál a speciális keresés oldal, ahol egy kényelmesebb felülettel találkozhatunk. Itt kiválaszthatjuk azt az időközt, amelyben a keresést kell végezni. Mindezek mellett itt még nagyon sok más fontos beállítást is elvégezhetünk. Így például korlátozhatjuk a keresendő dokumentum típusát (images, audio, video, binary, text vagy PDF; hallgatólagosan az All types opció az érvényes), meg lehet határozni, hogy csak egyértelmű keresés történjék, vagy figyelembe kell venni a hasonló oldalakat is (ez azt jelenti, hogy megjeleníti pl. a yahoo.com-ot, a www.yahoo.com-ot, és a yahoo.com/index.html-t is).

Egy másik fontos mozzanat a Waybach Machine által megjelenített oldalakkal kapcsolatban az, hogy minden utalás, melyek az oldalon találhatóak, nem a jelenlegí site-okra vonatkozik, hanem az archíváltakra. Ennek köszönhetően a szó szoros értelmében a "múlt internetében" érezhetjük magunkat. Ez nagyon sok lehetőséget kínál: a történészek rengeteg sajátosságra deríthetnek fényt 1996-tól napjainkig, a business-kutatók megvizsgálhatják azokat a business-terveket, melyek a cégek csődjéhez vezettek, a munkaadók megtekinthetik a munkatársaik vagy a munkára pályázók korábbi munkáit, a web-design-erek vizsgálhatják a korai web design-t stb.

Jelenleg ennek az archívumnak az alapján tematikus kollekciókat hoznak létre. Ezeken olyan web-anyagok találhatóak, melyek meghatározott eseményekkel, történésekkel vannak összefüggésben. Így például jelenleg a felhasználóknak olyan kollekciókat kínálnak, mint például "A szeptember 11-i események".

"A háló úttörői" (olyan események, melyek fontosak voltak az internet fejlődése szempontjából), vagy a "2000-es amerikai elnökválasztás". Tervezik új kollekciók létrehozását is.

Nem minden problémamentes

Természetes, hogy a Waybach Machine működése a több mint 120 terabájt információ ellenére is rengeteg problémát és kérdést vet fel. Mint ahogy azt már említettük, az adatok gyűjtése kereső pókok, spiderek segítségével történik, ugyanúgy, mint a keresőrendszerek esetében. A Waybach Machine esetében kéttípusú - szűk- és széleskörű - keresésről beszélhetünk.

A széleskörű keresés lényege, hogy az adatok gyűjtése maximálisan széles skálán történik, s lehetőleg lefedi az összes lehetséges forrást. A szűk keresés célja olyan információk begyűjtése, melyek meghatározott site-okon találhatók, vagy konkrét témával rendelkeznek. A széles keresés már régóta rengeteg kérdést vet fel. Ha egy olyan robot létrehozása, amely teljes mértékben ki tudja használni a 100 Mbit/sec csatorna áteresztőképességét, nem okoz komolyabb gondot, akkor egy ilyen pók "megetetése" jóval nehezebb feladat.

Ilyen intenzitású munka mellett a robot képes lesz heti 150 millió oldalt lefedni, s mintegy 40-60 napig fog ilyen ütemben dolgozni. Ugyanakkor, mielőtt elvégezzük valamelyik oldal archíválását, ellenőrizni kell, nincs-e véletlenül ennek az oldalnak a másolata az archívumban. Ezek a műveletek a RAM-ban történnek. Ez természetesen jelentős mértékben leterheli a RAM-ot, s a rendszer lelassul.

A széles keresés problémáját illető másik aspektus az, hogy nagyon leterheli a site-ok szervereit is. Nem minden szerver képes arra, hogy kibírja egy olyan kereső pók nyomását, amelyik naponta több tízmillió site-ot "rág át".

Vagyis ebben az esetben két változat lehetséges: vagy a program-robot elég intelligens ahhoz, hogy korlátozza a szerverre gyakorolt nyomását, mert ellenkező esetben a szerver összeomolhat, vagy a Waybach Machine site-ja sem mindig elérhető. Gyakran előfordul az, hogy amikor megnyitjuk a site-ot, azt olvassuk, hogy "a nagyszámú bekérdezések miatt" a site nem elérhető. Vagy az "Internet Archive Site" műszaki okok miatt ideiglenesen nem működik.

Megjegyzendő, hogy az archívum látogatottsága valóban nem kevés, eléri a napi 5 millió látogatót. De annak következtében, hogy nagyon bonyolult a publikált anyagok kiszűrését szolgáló mechanizmus, hiszen az inteneten egy valamilyen anyag egyszerre több helyen is előfordúlhat, így az ilyen keresésé során 30%-os az ismétlődések aránya.

Egyes site-ok tulajdonosai, ilyen vagy olyan okok miatt nem szeretnék, ha a web-oldaluk indexálva lenne. Ezért korlátozzák az archiváló robot hozzáférését a site tartalmához (ezt úgy lehet megoldani, hogy meghatározzuk a szükséges direktívákat a robots.txt fájlban, a site gyökérkönyvtárában).

Igaz azonban az is, hogy ha az archívumban való böngészés során egy ilyen site-ra való utalásra bukkanunk, akkor megtalálhatjuk az adott fájl másolatát is, valamint megismerhetjük az okot, hogy ebben az esetben miért hiányoznak a rendelkezésre álló anyagok. Egyébként abban az esetben, ha ki kell törölni valamilyen, már korábban megmentett anyagot az archívumból, akkor ezt meg lehet tenni egy speciális oldalon.

Természetesen mint mindig, most is felmerül a finanszírozás kérdése. Évente csak az adattárolókra 40 000 dollárt költenek. Az archívum fizikailag három helyen található. Ebből kettő San-Francisco környékén, és egy az új Alexandriai könyvtárban található, Egyiptomban.

A Waybach Machine nem kereskedelmi projekt, és a site-on nincsenek is reklámok, amelyek képesek lennének legalább valamilyen mértékben kompenzálni a kiadásokat. Jelenleg a finanszírozás önkéntes alapon történik, vagyis egyes magánszemélyek és cégek fedezik a működési költségeket. A partnerek között, akik az első oldalon vannak feltüntetve, olyan nevek olvashatóak, mint az AT&T Research, a Compaq, a Prelinger Archives, a QuantumDLT, és a Xerox PARC.

A Waybach Machine elnöke abban bízik, hogy a későbbiekben létrejön egy összevont projekt, s az ő cége csak az első vállalkozás lesz egy teljes céghálózat keretében. Ez egy nagy feladat megoldására - a tudás, az információ összegyűjtésére, megmentésére, bárki számára történő hozzáférhetőségének biztosítására - fog megszületni.

Jurij Dzjuban

Forrás: http://www.computerra.ru/


Az érdekesség kedvéért megnéztük az index.hu-t. A dátum 1999. október 12.

(A kép kinagyításához klikkelj a képre).

Az index.hu nyitóoldala 1999. október 12.-én

Az index.hu nyitóoldala 1999. október 12.-én

Ilyen címeket olvashatunk:

Újabb bombagyáros rendorkézen, Nisben hétezren követelték Szlobodan Milosevics elnök távozását, Olajos rendőrök: most Sarkadon vádolnak, Orbán: Pepónak kell tisztára mosnia Aradit stb.

De rég is volt...


 
 Kapcsolódó linkek
· Adatok: Világháló
· Írta: runet


A legolvasottabb cikk a következő kategóriában: Világháló:
Az internet legújabb története: Yahoo!



 A cikk pontszáma
Átlag pontszám: 4.14
szavazat: 7


Kérjük pontozással nyilvánits véleményt az adott cikkről:

Excellent
Very Good
Good
Regular
Bad




 Beállítások

Nyomtatható változat Nyomtatható változat

Küldd el levélben!Küldd el levélben!



 A legolvasottabb cikkek
1. A Szabadság-szobor eltüntetése. (Egyéb illúziók. 1993) - (55489 olvasás)
2. Repülés. (Feléledt vágyak. 1992) - (49571 olvasás)
3. A Kínai Nagy Falon való áthatolás. (Egyéb illúziók.1986) - (42452 olvasás)
4. Áthatolás a tükrön keresztül. (Zuhanás a Niagara vízesésbe 1990) - (38622 olvasás)
5. Furcsa találmányok I. - (36107 olvasás)
6. Az alapok alapja. A BIOS. I - (34651 olvasás)
7. Százdolláros bankjegy átdöfése egy ceruzával - (31782 olvasás)
8. Furcsa találmányok II. - (31577 olvasás)
9. A lézer - (28783 olvasás)
10. Az alapok alapja. A BIOS. II - (28160 olvasás)
11. Furcsa találmányok VI. - (28110 olvasás)
12. Lerajzolt kártya. (Zuhanás a Niagara vízesésbe. 1990) - (26765 olvasás)
13. A halálos fűrész - (26667 olvasás)
14. A keleti expressz eltüntetése. (A keleti expressz talánya. 1991) - (26463 olvasás)
15. A David Copperfielden való áthatolás. (Repülések: feléledt vágyak) - (23745 olvasás)
16. Gyűrű a homokórán. (Zuhanás a Niagara vízesésbe. 1990) - (22302 olvasás)
17. Pandóra szelencéje - (22129 olvasás)
18. Megjelenés a semmiből - (22108 olvasás)
19. A Tűztornádó titkai - (21810 olvasás)
20. Egy lány feldarabolása több részre. (Zuhanás a Niagara-vízesésbe. 1990) - (21333 olvasás)
21. A repülőgép eltüntetése - (21029 olvasás)
22. UFO-balesetek a volt Szovjetunió területén I. - (20925 olvasás)
23. Amazon szertartás - (20187 olvasás)
24. Furcsa találmányok V. - (20122 olvasás)
25. A Barkley-ház. (Ismeretlen erők. 1995) - (19876 olvasás)
26. Furcsa találmányok III. - (19849 olvasás)
27. Furcsa találmányok IV. - (19235 olvasás)
28. A leskelődő - (19158 olvasás)
29. Az internet-függőség a drogfüggőséghez vagy az alkoholizmushoz hasonlítható 1. - (19010 olvasás)
30. Repülő rózsa. (A keleti expressz talánya. 1991) - (18961 olvasás)
31. A repülő fotel - (18746 olvasás)
32. A kés. (Ismeretlen erők. 1995) - (18394 olvasás)
33. A kacsa - (17727 olvasás)
34. UFO-balesetek a volt Szovjetunió területén II. - (17451 olvasás)
35. Táncoló asztal. (Ismeretlen erők. 1995) - (17045 olvasás)
36. A falon lévő rajz jövendölése. (Repülések: a feléledt vágyak. 1992) - (16949 olvasás)
37. Menekülés a felrobbanó épületből - (16655 olvasás)
38. A vörös ruhás lány. (A szenvedély máglyái. 1993) - (16522 olvasás)
39. HDD-élet a halál után - (16329 olvasás)
40. Távirányítózunk - (16263 olvasás)
41. Lebegés a szökőkúton. (A keleti expressz talánya. 1991) - (16195 olvasás)
42. A nagy fekete láda. (A keleti expressz talánya. 1991) - (16073 olvasás)
43. Metamorfózis. (A szenvedély máglyái. 1993) - (15935 olvasás)
44. Az élet biztosan nem a Földön keletkezett. Első rész - (15830 olvasás)
45. A gordiuszi csomó - (15540 olvasás)
46. Tinta-háromszög. (Repülések: feléledt vágyak.1992) - (15347 olvasás)
47. Az internet legújabb története: Yahoo! - (15124 olvasás)
48. Apró trükkök 2 - (15086 olvasás)
49. A virtuális valóság eszközei - (15085 olvasás)
50. Könyvtár helyett Internet - (15041 olvasás)


"Könyvtár helyett Internet" | Belépés/Regisztráció | 0 hozzászólás
Küszöb
Minden hozzászólás a szerzők tulajdona. Nem feltétlenül értünk egyet velük, és nem vállalhatunk felelősséget a hozzászólások tartalmáért.

Névtelenül nem lehet hozzászólni, kérjük regisztrálj

 

A közölt anyagok fordítása, máshol való megjelentetése, sokszorositása és adatrendszerekben való tárolása kizárólag a portál tulajdonosának engedélyével történhet.

(c) 2003-2011 RuNet


webmester(kukac)runet.hu