Oglas
Kada je riječ o internetskim bazama podataka i informacijama koje se mogu naći unutar onoga što je općenito poznato pod nazivom "nevidljivi web 12 najboljih pretraživača za istraživanje nevidljivog webaGoogle ili Bing ne mogu sve pretraživati. Da biste istražili nevidljivi web, trebate koristiti ove posebne tražilice. Čitaj više ", Nisam tipičan korisnik. Svakako, trošim malo previše vremena prolazeći kroz internetske baze podataka na mjestima kao što su Nacionalni arhiv i CIA FOIA čitajući sobu, ali moram reći da me ništa više ne uzbuđuje nego kada nađem tablicu utemeljenu na HTML-u ispunjenu količinom naizgled složenih i nepovezanih podaci.
Činjenica je da su tablice podataka zlatno rudnik važnih istina. Podaci se često prikupljaju od vojske koje prikupljaju čizme s čizmama na zemlji. Dobivate ljude iz američkog popisa koji putuju po cijeloj zemlji radi podataka o domaćinstvu i obitelji. Na raspolaganju su vam neprofitne ekološke skupine koje prikupljaju sve vrste zanimljivih podataka o okolišu, zagađenju, globalnom zagrijavanju i još mnogo toga. A ako ste u paranormalnom ili Ufološkom stanju, na nebu se nalazi i stalno ažurirane tablice informacija o viđenju čudnih objekata na nebu.
Ironično, pomislili biste da bi bilo koja vlada na svijetu bila zainteresirana da zna kakvu vrstu strani brodovi uočeni su na nebu nad bilo kojom zemljom, ali očito ne - barem ne u SAD-u. u svakom slučaju. U Americi, zbirka neobičnih viđenja obrta prebačena je timima amaterskih hobista koji dolaze u nova viđenja NLO-a poput moljaca u plamen. Moje zanimanje za ta viđenja zapravo ne proizlazi iz fascinacije strancima ili zanatima s drugih planeta, već iz znanstvene fascinacije obrascima - gdje i zašto više ljudi vidi stvari na nebu i mogu li ta viđenja odražavati nešto vrlo stvarno i mnogo više na Zemlju zapravo ide na.
Da bih istražio količinu podataka prikupljenih od strane timova hobista NLO-a, zapravo sam razvio način uvoza velikih HTML tablica podatke u Google proračunsku tablicu, a zatim manipulirati i analizirati te podatke kako biste izdvojili i otkrili značajne i važne informacija. U ovom članku namjeravam vam pokazati kako to učiniti.
Važni HTML podaci u Google proračunskoj tablici
U ovom primjeru pokazat ću vam kako uvezete sve podatke koji se mogu pohraniti u tablici na bilo kojoj web stranici na Internetu u vašu Google proračunsku tablicu. Razmislite o ogromnoj količini podataka koji su danas na internetu dostupni u obliku HTML tablica. Samo Wikipedija ima podatke u tablicama za teme poput globalno zatopljenje, američki Biro za popis stanovništva ima tona skupovi podataka o stanovništvu, a malo googlea nadmašit će vas puno više od toga.
U svom primjeru započinjem s bazom podataka na Nacionalnom centru za izvješćivanje o NLO-u koja zapravo izgleda kao da bi to mogla biti upitna dubinska baza podataka, ali ako primijetite Strukturiranje URL-ova zapravo je polu-složeni web-sustav izvješćivanja koji se sastoji od statičkih web stranica i statičkih HTML tablica - upravo onog što želimo pri traženju podataka uvoz.
NUForc.org jedna je od organizacija koja služi kao jedan od najvećih izvještajnih centara za posmatranje NLO-a. Nije jedini, ali dovoljno je velik da svaki mjesec možemo pronaći nove skupove podataka s trenutnim viđenjima. Podaci ste odlučili pregledati prema kriterijima kao što su Stanje ili Datum, a svaki od njih nalazi se u obliku statičke stranice. Ako sortirate po datumu, a zatim kliknete na najnoviji datum, vidjet ćete da u tamo navedenoj tablici stoji statična web stranica imenovana prema formatu datuma.
Dakle, sada imamo obrazac za redovito vađenje najnovijih informacija o viđenjima iz ove baze podataka temeljene na HTML-u. Sve što trebate učiniti je uvesti prvu tablicu, upotrijebiti najnoviji unos (gornji) za prepoznavanje najnovije ažuriranje, a zatim upotrijebite datum tog objavljivanja za izgradnju URL adrese u kojoj se nalazi najnovija tablica HTML podataka postoji. Ako to učinite, jednostavno će biti potrebno nekoliko primjeraka funkcije ImportHTML, a zatim nekoliko kreativnih korištenja funkcija za upravljanje tekstom. Po završetku imat ćete jednu od najboljih, proračunskih tablica za izvještavanje o vlastitim ažuriranjima koja se sami ažuriraju. Započnimo.
Uvoz tablica i manipuliranje podacima
Prvi korak je, naravno, izrada nove proračunske tablice.
Dakle, kako uvesti HTML tablice? Sve što trebate je URL u kojem je pohranjena tablica i broj tablice na stranici - obično je prva navedena 1, druga 2 i tako dalje. Budući da znam URL navedene prve tablice u kojoj su navedeni datumi i navedeni brojevi viđenja, moguće ih je uvesti upisivanjem sljedeće funkcije u ćeliju A1.
= ImportHtml ( „ http://www.nuforc.org/webreports/ndxpost.html?”&H2,”table”,1)
H2 drži funkciju "= sat (sad ())", Pa će se tablica ažurirati na svakih sat vremena. To je vjerojatno ekstremno za podatke koji to rijetko ažuriraju, pa bih se vjerojatno mogao izvući s svakodnevnim radom. U svakom slučaju, gornja funkcija ImportHTML donosi tablicu kao što je prikazano u nastavku.
Morat ćete malo manipulirati podacima na ovoj stranici kako biste mogli sastaviti URL za drugu tablicu sa svim NLO viđenjima. Ali samo naprijed i stvorite drugi list na radnoj knjižici.
Prije nego što pokušate napraviti ovaj drugi list, vrijeme je da izvadite datum objave iz ove prve tablice kako biste izgradili vezu do druge tablice. Problem je što se datum dovodi kao format datuma, a ne kao niz. Dakle, prvo morate koristiti TEXT funkciju za pretvaranje datuma objave izvješća u niz:
= tekst (A2, "mm / dd / yy")
U sljedećoj ćeliji s desne strane trebate upotrijebiti SPLIT funkciju s razgraničavanjem "/" da biste datum podijelili na mjesec, dan i godinu.
= podijeljen (D2, ”/”)
Izgledaš dobro! Međutim, svaki broj treba biti prisiljen na dvije znamenke. Učinite to u ćelijama odmah ispod njih koristeći ponovo naredbu TEXT.
= tekst (E2, „00 ″)
Format "00" (to su nula) daje dvije znamenke ili "0" kao rezervirano mjesto.
Sada ste spremni obnoviti cijeli URL do najnovije HTML tablice novih viđenja. To možete učiniti pomoću funkcije CONCATENATE i kombiniranjem svih bita informacija koje ste upravo izvukli iz prve tablice.
= CONCATENATE ( „ http://www.nuforc.org/webreports/ndxp”,G3,E3,F3,”.html”)
Na novom listu koji ste prethodno stvorili (prazan list) radit ćete novu funkciju "importhtml", ali ovaj put za prvu Parametar URL veze, tako da ćete se vratiti na prvu proračunsku tablicu i kliknuti na ćeliju s URL vezom koju ste upravo stvorili.
Drugi parametar je "tablica", a posljednji je "1" (jer je pregledna tablica prva i jedina na stranici). Pritisnite Enter, a upravo ste uveli cjelokupni broj viđenja koja su objavljena tog dana.
Dakle, vjerojatno mislite da je ovo lijep novitet i sve - mislim, na kraju krajeva, sve što ste napravili je izdvojeno postojeće informacije iz tablice na Internetu i premještene su u drugu tablicu, iako privatnu u vašim Google dokumentima račun. Da, to je istina. Međutim, sada kada je to na vašem privatnom računu Google Dokumenata, na dohvat ruke imate alate i funkcije za bolju analizu tih podataka i započinjte otkrivanje nevjerojatnih veza.
Korištenje okretnih izvješća za analizu uvezenih podataka
Nedavno sam napisao članak o korištenju Zaključna izvješća u Google proračunskoj tablici Postanite ekspertni analitičar podataka preko noći koristeći alate za izvješća Google proračunske tabliceJeste li znali da je jedan od najvećih alata za analizu podataka zapravo Google Spreadsheet? Razlog za to nije samo zato što može učiniti gotovo sve što želite ... Čitaj više za izvršavanje svih vrsta cool podviga analize podataka. Pa, možete napraviti iste nevjerojatne akrobacije podataka za podatke koje ste uveli s Interneta - daje vam mogućnost da otkrijete zanimljive veze koje možda nitko prije nije otkrio vas.
Na primjer, iz tablice završnog razgledavanja, možda ću se odlučiti pomoću stožernog izvještaja da bih pogledao broj različiti jedinstveni oblici prijavljeni u svakoj državi u odnosu na ukupni broj viđenja u toj pojedinoj državi država. Na kraju, filtriram i sve što spominjemo "vanzemaljce" u odjeljku komentara, kako bih nadao da ćemo ukloniti neke od više pločastih unosa.
To zapravo otkriva neke prilično zanimljive stvari odmah ispod šišmiša, poput činjenice da Kalifornija očito ima najviše broj prijavljenih viđenja bilo koje druge države, zajedno s razlikovanjem prijavljivanja najvećeg broja oblika zanata u državi zemlja. To također pokazuje da su Massachusetts, Florida i Illinois također veliki napadači u odjelu za promatranje NLO-a (barem u najnovijim podacima).
Još jedna zgodna stvar o Google Spreadsheet-u je širok raspon raspoloživih grafikona, uključujući Geo-kartu koja vam omogućava iznijeti "vruće točke" podataka u grafičkom formatu koji se stvarno ističe i čini te veze unutar podataka poprilično očigledan.
Ako razmislite, ovo je doista samo vrh ledenog brijega. Ako sada možete uvesti podatke iz tablica podataka na bilo kojoj stranici na Internetu, samo razmislite o mogućnostima. Nabavite najnovije brojeve dionica, ili najnovijih najboljih 10 knjiga i autora na listi bestselera New York Timesa ili najprodavanijih automobila na svijetu. Postoje HTML tablice na gotovo svim temama koje možete zamisliti, a u mnogim slučajevima te se tablice često ažuriraju.
ImportHtml vam daje mogućnost povezivanja vaše Google proračunske tablice na Internet i punjenje podataka koji postoje vani. To može postati vaše osobno središte informacija koje možete koristiti za manipuliranje i masažu u format s kojim zapravo možete raditi. To je samo još jedna vrlo cool stvar koju treba voljeti o Google Spreadsheet-u.
Jeste li ikad uveli podatke u svoje proračunske tablice? Kakve ste zanimljivosti otkrili u tim podacima? Kako ste koristili podatke? Podijelite svoja iskustva i ideje u odjeljku s komentarima u nastavku!
Slikovni krediti: Poslovni grafikon
Ryan je diplomirao elektrotehniku. Radio je 13 godina u inženjerstvu automatizacije, 5 godina u IT-u, a sada je Apps inženjer. Bivši glavni urednik MakeUseOfa, govorio je na nacionalnim konferencijama o vizualizaciji podataka i bio je prikazan na nacionalnoj televiziji i radiju.