01
Avaa PDF selaimessasi
Pudota PDF laatikkoon tai valitse tiedosto. Se luetaan sivulla sisäänrakennetulla PDF-lukijalla, eikä sitä koskaan lähetetä palvelimelle.
PDF-tarkistin
Kaikille, jotka eivät saa kopioitua tekstiä PDF:stä ja haluavat tietää miksi.
Pudota PDF ja näe heti, ovatko sen sivut oikeaa, valittavaa tekstiä vai pelkkiä skannattuja kuvia. Tarkistus tapahtuu kokonaan selaimessasi — tiedostoa ei koskaan ladata palvelimelle.
Näin tarkistus toimii
01
Pudota PDF laatikkoon tai valitse tiedosto. Se luetaan sivulla sisäänrakennetulla PDF-lukijalla, eikä sitä koskaan lähetetä palvelimelle.
02
Tarkistin etsii valittavaa tekstiä jokaiselta sivulta. Digitaalisilla sivuilla on oikeita merkkejä; skannatuilla sivuilla niitä ei ole lainkaan.
03
Saat tietää, onko PDF haettava, skannattu vai sekamuotoinen — ja mitä se tarkoittaa taulukoiden siirtämiselle Exceliin.
Mitä tulos tarkoittaa
Teksti on oikeaa ja valittavaa. Voit kopioida sen, mutta kopiointi ja liittäminen litistää taulukon yleensä yhdeksi sarakkeeksi, koska PDF tallentaa sijoitellun tekstin, ei soluja. Poimi taulukko rakenteineen, jotta rivit ja sarakkeet säilyvät.
Sivu on kuva, joten kopioitavaa tekstiä ei ole lainkaan. Taulukoiden saaminen ulos vaatii OCR:n, joka rakentaa rivit ja sarakkeet uudelleen kuvasta — juuri se tehtävä, jota varten Image to Excel -laajennus on tehty.
Osa sivuista on digitaalisia ja osa skannattuja liitteitä. Tarkistin kertoo, kuinka monella sivulla on valittavaa tekstiä, joten tiedät, mitkä sivut tarvitsevat OCR:ää.
Seuraava vaihe
Olipa PDF skannattu tai haettava, taulukko on edelleen lukittuna sivulle. Image to Excel -Chrome-laajennus lukee taulukot PDF:istä, skannauksista, kuvakaappauksista ja kuvista, antaa sinun tarkistaa tuloksen ja vie siistin XLSX- tai CSV-tiedoston — suoraan avoimesta välilehdestä.
UKK
Yritä valita tekstiä PDF:stä. Jos voit korostaa sanoja, kyseessä on haettava digitaalinen PDF. Jos mikään ei korostu, sivu on kuva ja PDF on skannattu. Tämä tarkistin lukee jokaisen sivun tekstikerroksen ja kertoo vastauksen puolestasi.
Ei. Tarkistus tapahtuu kokonaan selaimessasi sisäänrakennetulla PDF-lukijalla. Tiedostoa ei koskaan lähetetä palvelimelle.
Skannatut sivut ovat kuvia, joten tarvitset OCR:n, joka rakentaa rivit ja sarakkeet uudelleen kuvasta. Image to Excel -Chrome-laajennus lukee taulukot skannatuista PDF:istä ja kuvista ja vie XLSX:n tai CSV:n nopean tarkistuksen jälkeen.
PDF tallentaa sijoiteltuja tekstinpätkiä, ei oikeita soluja, joten kopiointi litistää taulukon yleensä yhdeksi yhteen sulautuneeksi sarakkeeksi. Jotta rivit ja sarakkeet säilyvät, poimi taulukko rakenteineen sen sijaan, että kopioit raakatekstin.
Kyllä. Monissa asiakirjoissa digitaaliset sivut yhdistyvät skannattuihin liitteisiin. Tarkistin kertoo, kuinka monella tarkistetuista sivuista on valittavaa tekstiä, joten tiedät, mitkä sivut tarvitsevat OCR:ää.