Hjemmeside » hvordan » Byg en Download Scheduler med lidt programmeringsevner

    Byg en Download Scheduler med lidt programmeringsevner

    Vi elsker alle at downloade ting fra internettet, og der er masser af gode downloadhåndteringsværktøjer, som vi kan bruge til at planlægge vores downloads. Det kan bare være nemmere at bruge en download manager, men der er ingen skade i at udforske de værktøjer, der allerede kommer med vores Ubuntu og udnytte det fuldt ud.

    I denne artikel vil vi vise dig en indbygget software i Ubuntu, som vi kan bruge til at downloade ting fra internettet ved hjælp af wget. Derudover vil vi vise dig, hvordan du planlægger downloaden ved hjælp af Cron.

    Download Brug Wget

    Wget er en gratis softwarepakke til hentning af filer ved hjælp af HTTP, HTTPS og FTP, de mest anvendte internetprotokoller. Det er et ikke-interaktivt kommandolinjeværktøj, så det kan nemt kaldes fra scripts, cron-job, terminaler uden X-Windows-support osv..

    Åbn din terminal og lad os undersøge, hvordan vi kan bruge wget til at downloade ting fra nettet. Den grundlæggende syntaks for downloading med wget er følgende:

    wget [option] ... [URL] ...

    Denne kommando downloader wget manualen til dit lokale drev

    wget http://www.gnu.org/software/wget/manual/wget.pdf

    Linux Cron

    Ubuntu leveres med en cron-dæmon, der bruges til planlægning af opgaver, der skal udføres på et bestemt tidspunkt. Crontab giver dig mulighed for at angive handlinger og tider, som de skal udføres. Sådan planlægger du normalt en opgave ved hjælp af kommandolinjeværktøjet.

    Åbn et terminalvindue og indtast crontab -e.

    Hver af sektionerne i en crontab er adskilt af et mellemrum, hvor den endelige sektion har et eller flere mellemrum i den. En cron indtastning består af minut (0-59), time (0-23, 0 = midnat), dag (1-31), måned (1-12), hverdag (0-6, 0 = søndag), kommando. Den tredje post i ovenstående crontab downloads wget.pdf klokken 2. Første indgang (0) og anden indgang (2) betyder 2:00. Den tredje til den femte post (*) betyder enhver tid på dagen, måneden eller ugen. Den sidste post er wget-kommandoen for at downloade wget.pdf fra den angivne webadresse.

    Det er det grundlæggende på wget og hvordan Cron virker. Lad os tage et løfte på et rigtigt livs eksempel på, hvordan du planlægger en download.

    Planlægning Download

    Vi skal downloade Firefox 3.6 klokken 2. Da vores internetudbyder kun giver en begrænset mængde data, skal vi stoppe overførslen klokken 8. Sådan ser opsætningen ud.

    Ignorer de første 2 poster i ovenstående crontab. Den tredje og fjerde kommando er de eneste 2 kommandoer, du har brug for. Den tredje kommando opsætter en opgave, der downloader Firefox klokken 2:

    [kode]
    0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=da-GB
    [/kode]

    Optionerne -c angiver, at wget skal genoptage den eksisterende download, hvis den ikke er afsluttet.

    Den fjerde kommando stopper wget klokken 8. 'Killall' er en unix-kommando, der dræber processer ved navn.

    [kode]
    0 8 * * * killall wget
    [/kode]

    Killall wget fortæller Ubuntu at stoppe wget fra at downloade filen klokken 8.

    Andre nyttige wget kommandoer

    1. Angivelse af mappen for at downloade en fil

    [kode]
    wget -output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
    [/kode]

    indstillingen -output-dokumentet giver dig mulighed for at angive mappen og navnet på den fil, du downloader

    2. Downloadning af et websted

    wget er også i stand til at downloade en hjemmeside.

    [kode]
    wget -m http://www.google.com/profiles/zainul.franciscus
    [/kode]

    Ovenstående kommando vil downloade hele min google-profilwebside. Alternativet '-m' fortæller wget at downloade et 'spejl' billede af den angivne webadresse.

    En anden vigtig mulighed er at fortælle wget, hvor mange links der skal følge, når den downloader et websted.

    [kode]
    wget -r -l1 http://www.google.com/profiles/zainul.franciscus
    [/kode]

    Ovennævnte Wget-kommando bruger to muligheder. Den første mulighed '-r' fortæller wget at downloade den angivne hjemmeside rekursivt. Den anden mulighed '-l1' fortæller wget at kun få det første niveau af links fra den angivne hjemmeside. Vi kan indstille op til tre niveauer '-l2' og '-l3'.

    3. Ignorer robot entry

    Webmaster vedligeholder en tekstfil kaldet Robot.txt. 'Robot.txt' vedligeholde en liste over webadresser, som en websidercrawler som wget ikke skal gennemgå. Vi kan fortælle wget at ignorere 'Robot.txt' med '-erobots = off' indstillingen. Følgende kommando fortæller wget at downloade den første side i min google-profil og ignorere 'Robot.txt.

    [kode]
    wget -erobots = fra http://www.google.com/profiles/zainul.franciscus
    [/kode]

    En anden nyttig mulighed er -U. Denne indstilling vil maskere wget som en browser. Bemærk, at maskering af et program, da et andet program kan krænke en webudbyders betegnelse og service.

    [kode]
    wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
    [/kode]

    Konklusion

    Wget er en meget gammel skole endnu hackable GNU softwarepakke, som vi kan bruge til at downloade filer. Wget er et interaktivt kommandolinjeværktøj, hvilket betyder at vi kan lade det køre på vores computer i baggrunden uden at skulle starte nogen applikation. Tjek wget man siden

    [kode]
    $ mand wget
    [/kode]

    at forstå andre muligheder, som vi kan bruge med wget.

    Links

    Wget Manual
    Sådan kombineres to downloadede filer Når wget fejler halvvejs igennem
    Linux QuickTip: Downloading og un-tarring i et trin