Jump to content

General web question


Zen Mod

Preporučeni Komentari

Miko - da li je moguce - na neki nacin - dobiti informaciju koliko je neki sajt "tezak" ?elem - skidam vacuumstate.com site ( sa WinHTTrack , koji je uvek korektno odradjivao ) i eve me vec na 2.9GB i ne vidim kad ce da zavrsi .... :sarcastic_hand:podesenja po defaultu , sto ce reci da ne skida po linkovima usput jos pola weba ....... :serbvidkakisicl0:

Link to comment
Podeli na ovim sajtovima

  • Odgovora 44
  • Kreirano pre
  • Zadnji odgovor pre

Aktivni članovi u ovoj temi

Aktivni članovi u ovoj temi

Kad pročitaš ovo: http://www.httrack.com/HelpHtml/fcguide.html ili još prostije ovo: http://forum.httrack.com/readmsg/14245/14243/index.html?q=how+to+find+out+size+of+a+websiteDođeš do odgovora da zapravo ne možeš odrediti veličinu sajta dok ga PRVO ne skineš. Nije utešno, ali izgleda da je fakat.

Link to comment
Podeli na ovim sajtovima

Nešto mi se mota po glavi da ima način: ima mogućnost (naravno, ne sećam se detalja, ni blizu) da se uradi „skidanje“ al' bez pravog skidanja i tako odredi veličina. Dakle, brže je jer ne idu podaci već samo ('ajd da kažem tako) header-i u kojima je i podatak o veličini...

Link to comment
Podeli na ovim sajtovima

Biće da se Zen vratio na dial up pa je zabrinut za telefonski račun... :buehehe:

(jes, kur moj, nego on bi sada da skine sve pa ga zanima jel ima dosta hardova...)

Neka, ne treba da se brine, pre ili kasnije svaki od linkova završi na istom mestu...

ovde...

A tehnički gledano, sve ima kraj, a internet, kao i batina, kobasica i gliste, ima dva kraja, ovde je drugi kraj

Link to comment
Podeli na ovim sajtovima

Takva mogucnost postoji samo ako je server na kome se nalazi zeljeni sajt setovan da dozvoljava listanje direktorijuma, sto najcesce nije slucaj...

Znam na šta misliš. Al', i dalje, mislim da može i ako (iako) nema list-anja... Ako se setim...
Link to comment
Podeli na ovim sajtovima

Znam na šta misliš. Al', i dalje, mislim da može i ako (iako) nema list-anja... Ako se setim...

Ne moze Zile - web server mora da dozvoli brkanje po file system-u da bi moglo - kako drugacije da kroz port 80 procitas velicinu fajla?
Link to comment
Podeli na ovim sajtovima

Ne moze Zile - web server mora da dozvoli brkanje po file system-u da bi moglo - kako drugacije da kroz port 80 procitas velicinu fajla?

moze ako imas robote kao Google - precesljaju ti sve javno dostupne fajlove za pola sata na bilo kom sajtu i izracunaju velicinu.no teze malo da ce Google da iznosi javno takve podatke. :sarcastic_hand:
Link to comment
Podeli na ovim sajtovima

Ma moze i Toyotin robot da bude - dzaba ako mu server ne dozvoli "directory listing" - jednostavno samo pitanje o velicini je zabranjeno ...Google-ov robot dobije podatak o velicini tek kada skine i cache-ira file...

Link to comment
Podeli na ovim sajtovima

Google-ov robot dobije podatak o velicini tek kada skine i cache-ira file...

pa o toj informaciji i pricam to sto je u Cache - no nece na tacni da izlistaju tebi i meni na Google koliko je to zbirno. :sarcastic_hand: ili waybackmachine robot:http://replay.waybackmachine.org/20090225105144/http://www.vacuumstate.com/ima klon celog - no nigde ne pise koliko je to veliko
Link to comment
Podeli na ovim sajtovima

zavrsio;u folderu - ukljucujuci i cache folder , simljeno 3,42GBerror log:

HTTrack3.43-7+htsswf+htsjava launched on Sun, 06 Mar 2011 02:37:14 at www.vacuumstate.com/ +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar(winhttrack -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2008], %s -->" -%l "en, en, *" www.vacuumstate.com/ -O1 "D:\RAZNI SAJTOVI\Allen Wright\Vacuum State" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )Information, Warnings and Errors reported for this mirror:note: the hts-log.txt file, and hts-cache folder, may contain sensitive information, such as username/password authentication for websites mirrored in this project do not share these files/folders if you want these information to remain private02:37:16 Info: Note: due to www.vacuumstate.com remote robots.txt rules, links begining with these path will be forbidden: /log, /log2, /test, /WS_Admin (see in the options to disable this)02:56:51 Error: "Not Found" (404) at link www.vacuumstate.com/css/verlauf.jpg (from www.vacuumstate.com/css/shop.css)Too many URLs, giving up..(>100000)To avoid that: use #L option for more links (example: -#L1000000)

usput - majstor zabavljajuci se - zaboravio da je ceo Borbely site skinut sa neta i pokrenuo update istog ; rezulatat - sa imam prazan Borbely site folder u kompu :frusty::frusty::frusty:
Link to comment
Podeli na ovim sajtovima

usput - majstor zabavljajuci se - zaboravio da je ceo Borbely site skinut sa neta i pokrenuo update istog ; rezulatat - sa imam prazan Borbely site folder u kompu :frusty::frusty::frusty:

:siroma:
Link to comment
Podeli na ovim sajtovima

Ne mogu da nađem moju sveščicu iz Win vremena...Hint koji liči na ono što sam radio jeste. http://stackoverflow.com/questions/1476034/determine-the-file-size-before-dowloading-data-through-httpNo, tada, nisam koristio te i takve alate... Setiću se, kad prestanem da se trudim...

Link to comment
Podeli na ovim sajtovima

Izgleda da definitivno nema sanse:>wget --spider --server-response http://www.diyaudio.rsSpider mode enabled. Check if remote file exists.--2011-03-07 10:21:41-- http://www.diyaudio.rs/Resolving proxy.rcub.bg.ac.rs (proxy.rcub.bg.ac.rs)... 147.91.1.41, 147.91.1.42, 147.91.1.44, ...Connecting to proxy.rcub.bg.ac.rs (proxy.rcub.bg.ac.rs)|147.91.1.41|:8080... connected.Proxy request sent, awaiting response... HTTP/1.0 200 OK X-Powered-By: PHP/5.3.2-1ubuntu4.7 Set-Cookie: session_id=1f942aac2add54cad338c45d99d7ce0c; path=/; httponly Content-Type: text/html;charset=UTF-8 Cache-Control: no-cache,must-revalidate, max-age=0 Expires: Sun, 06 Mar 2011 09:21:41 GMT Pragma: no-cache Content-Encoding: gzip Vary: Accept-Encoding Date: Mon, 07 Mar 2011 09:21:41 GMT Server: reboot.pro X-Cache: MISS from proxy.rcub.bg.ac.rs X-Cache-Lookup: MISS from proxy.rcub.bg.ac.rs:8080 Via: 1.0 proxy.rcub.bg.ac.rs:8080 (squid/2.6.STABLE6) Proxy-Connection: closeLength: unspecified [text/html]Remote file exists and could contain further links,but recursion is disabled -- not retrieving.'Oce reci ne da server!

Link to comment
Podeli na ovim sajtovima

ima li ko Borbely site mirror . po mogucnosti skorasnji - pred zatvaranje ?

Postavljena slika

inace - ukljucio sam ponovo skidanje VS , sa svim opcijama ukljucenim ;

poenta je bila u tome da - iako je smrz velicina mirrora , pola linkova (podstranica) je bilo nefunkcinalno

Link to comment
Podeli na ovim sajtovima

Kreiraj nalog ili se prijavi da daš komentar

Potrebno je da budeš član DiyAudio.rs-a da bi ostavio komentar

Kreiraj nalog

Prijavite se za novi nalog na DiyAudio.rs zajednici. Jednostavno je!

Registruj novi nalog

Prijavi se

Već imaš nalog? Prijavi se ovde

Prijavi se odmah
  • Članovi koji sada čitaju   0 članova

    • Nema registrovanih članova koji gledaju ovu stranicu
×
×
  • Kreiraj novo...