Próbáljanak meg válaszolni a kérdésre: mit csinál az ember, amikor információra van szüksége? Különböző válaszokat jósolhatok, kezdve attól, hogy "hívja a 09-et (tudakozó)", egészen addig, hogy "elmegy a könyvtárba". És mindegyikük helyes. Bővítsük ki a kérdést, s olvassuk el új formájában: Mit csinál az ember, amikor információra van szüksége és rendelkezésére áll az internet? És itt jön a válasz: természetesen kilép az internetre. A többi már a technika feladata: keresőrendszerek, korrekt lekérések, elavult és (vagy) nem működő hivatkozások... stb. De most nem erről van szó, hanem arról, hogy mit kezdjünk a fellelt (méghozzá nehezen megtalált) információval, ha az kismillió részből áll?.
Ezzel a problémával nem először találkoztam, de ebben az esetben már kicsit "sok volt". Nagyon fontos információra volt szükségem egy könyvből, amely HTML formátumban volt elhelyezve egy web-oldalon. Ilyenkor a világháló gyakorlott felhasználói azt mondják, nincs semmi gond, fogod a Teleport Pro, GetRigt, illetve a hasonló típusú programokat és előre! Igen, hasonló programok nélkül valószínűleg nehéz boldogulni, de elméletileg lehetséges.
A "felvilágosulatlan" olvasóknak elmondom, hogy a fentebb említett programok az URL alapján megtalálják a keresett honlapot és teljes tartalmával és felépítésével együtt eltárolják azt a merevlemezre.
De hogyan tovább? Olvasni a monitor képernyőjén a könyv mind a 200 oldalát (ez volt az én esetemben) - nem őrültség ez? De az, őrültség! Vagy, mikor mindig kéz alatt van egy nyomtató, akkor nem kinyomtatni az egészet - mazohizmus. És itt kezdődnek a problémák.
Amikor a könyvet HTML formátumban akarjuk nyomtatni, úgy, hogy az több száz "html", "gif" és "jpg" fájlokból áll. Az a helyzet, hogy amikor a könyvet egyetlen fájlba szerettem volna "összeragasztani" Word-ben, a körülmények alakulása teljesen kihozta belőlem a vadállatot. Majdnem törtem, zúztam.
Az első kérésem egy olyan program megírása volt, amely mindezt automatikusan elvégzi, még akkor is, ha a fejlesztése több időbe kerül, mintha saját kezűleg csinálnám meg. Azonkívül, a probléma ilyen megoldása arra is ráébresztett, hogy nem ez lesz az utolsó olyan könyv, amelyet az internetről szerzek meg. De, elgondolkodva egy kicsit, arra a következtetésre jutottam, hogy nem én vagyok az első, aki ilyen problémával találkozott (figyelembe véve az internet korát) és valaki ezt már megoldotta. Röviden szólva elhatároztam, hogy találok egy ilyen programot és elindultam a keresésére a "nagy hálón".
Itt egy kis kitérőt kell tennem. Nemrégiben, másfél hónappal ezelőtt egy hasonló problémával találkoztam. A különbség csak az volt, hogy egy program súgóját kellett kinyomtatnom. A súgó az eredeti Windows formátúmu volt, vagyis "hlp". Mindenki nagyon jól tudja, mit jelent ez.
Végül is a működési elve ugyanaz, mint a HTML-nek: ugyanazok az ugrások a hivatkozásokon (hiperlinkeken) keresztül, a szövegben. Ez természetesen előnyös, de nem a nyomtatásnál. A maximum, amit el tudtam érni ennél a formátumnál, hogy minden egyes részt külön-külön nyomtattam.
Gyorsan rájöttem, milyen mennyiségű papírba, és ami a fontosabb, mennyi elpazarolt időbe fog ez kerülni, ezért elvetettem ezt a nemkívánatos elfoglaltságot. És így viszonylag gyorsan megtaláltam az interneten egy nagyszerű programot - a "Help To RTF"-et. Ez a program valóban hasznos és akkor segített is. Az általa archivált anyag neve "hlp2rtf.zip" lett.
Most már az önök számára is érthető lesz, miért kezdtem el rögtön az FTP szervereken valami "htm2rtf.zip"-szerű dolgot keresni, mígnem az archiváló hamarosan előkerült. Óriási csalódás volt, amikor a program csak egyetlen megjelölt ".htm" vagy ".html" fájlt alakított át RTF formátumba, továbbá csak parancssorból működött.
A további kutakodás a világhálón semmilyen eredményre nem vezetett. Még valami hasonló dolog említésével sem találkoztam. Emlékeztem rá, honnét töltöttem le a "Help To RTF" konvertáló programot, de az csak egy személyes honlap volt, és azt, amire szükségem lett volna, nem tartalmazta. Így eljött az ideje, hogy szemügyre vegyem a fentebb említett konvertáló program súgóját.
Kiderült, hogy a program eredeti származási helye a http://www.herdsoft.com/, ami a német Herd Software Entwicklung céghez tartozik. Egy kicsit kirándultam a honlapon, és hála az angol nyelvű verziónak, rákattintottam valamire, ami kissé felvidított. A "Visitor" nevű program leírásában azt hirdették, hogy a segítségével egy teljes web-oldalt ".hlp" formátumba lehet menteni. Annak ellenére, hogy ez nem egészen az volt, amit kerestem, teljesen elégedett voltam.
Rögtön leszögezem: a programban nem csalódtam. És azonkívül, hogy sikerült egy teljes honlapot letölteni az internetről az URL címe szerint, nem használva ehhez semmilyen egyéb programot, lehetővé vált az oldalak konvertálása egyenesen RTF formátumban.
Megkérdezhetnénk, mi szükséges még az emberi boldogsághoz? Pedig megint gond van.
A probléma most a web-oldal konvertálása után lépett fel. A lényeg az, hogy a számomra szükséges könyv KOI-8-as kóddal rendelkezett, de a mi kedves Word-ünk a KOI-8-as betűtípusokat alapfelszereltségben nem tartalmazza. Így nem marad más hátra, mint az interneten barangolva megtalálni a megfelelő betűtípusokat. De a probléma megoldását nem ez jelentette volna. Hiszen nem ismeretes, hogy a következő könyv milyen kódolású lesz. És újra a WWW világába értem, hogy valamilyen átkódoló programot találjak.
Érdemes megemlíteni, hogy rengeteg ilyen programot lehetett találni. Igaz, többségük csak egyetlen fájlonként végezte a kódolást, mint ahogy azt a "htm2rtf" tette. De végül is megtaláltam egy megfelelő programot (a http://recoder.da.ru/ címen), amely különböző kódolásokra volt képes, továbbá négy kód egymásra építését is engedélyezte. Ennek a neve TOT-RECODE II. A programot Asot Oganeszjan (oroszországi) honfitársunk írta, s annak ellenére, hogy a kezelőfelülete angol, a súgója orosz nyelvű. Mindehhez hozzátartozik még az is, hogy nemcsak egyetlen oldal átkódolását tudja, hanem egész honlapokét vagy bizonyos mennyiségű kiválasztott fájlét is.
(A fenti bekezdésben az orosz kódlapról van szó. Előfordulhat azonban, hogy a magyar ékezetes betűkkel is gondok adódhatnak. Az Asot Oganeszjan által megírt program kezelőfelülete angol, így az orosz nyelvet nem ismerők is használni tudják.-RuNet)
Na tessék! Végül is minden elengedhetetlenül szükséges dolog össze van gyűjtve. Most már konvertáljuk a "könyves" oldalt KOI-8-ból Win-125-be, majd RTF formátumba, ezután pedig Word-be. És mindez fantasztikusan sikerült. A "Visitor" program a szöveg átalakításánál egy fájlba címzést és tárgymutatót is készített. Ez várható is volt, hiszen a "Help To RTF" (ugyanaz a cég) is rendelkezett hasonló szolgáltatással. És most már mi is rendelkezünk azzal a fájllal, amelyet kinyomtathatunk. Ezután a könyvet bárhol és bármikor olvashatjuk, nemcsak a monitor előtt ülve.
Remélem, hogy írásom hasznukra válik.
Szergej Nyematov
Forrás: http://msk.nestor.minsk.by/kg
|