Stránka 1 z 2

Překlad skenovaných PDF

Napsal: 16. 12. 2024, 2:17
od DwPetr
Němáte někdo tip na něco co je k něčemu a funguje?

Hodilo by se mi přeložit občas nějakej servisní manuál, zevrubně si to přečtu i v AJ, ale někdy je lepší si to pro jistotu u některých pasáží přeložit do ČJ. Google lens mi scan přeloží, ale jako dokument mi google naskenovanej list nepřeloží, takže padá ze hry. Klíčový je, aby to zachovalo po přeložení strukturu stránky. Ideální by bylo nahrát celý pdf, a na výstupu je mít celý přeložený. Ale nemám problém si je rozdrobit na jednotlivý listy a udělat to i po jednom. Existuje už v dnešní době něco takovýho co si poradí se scanem a dokáže zachovat strukturu stránky s obrázky?

Děkuju pěkně

edit: funguju na linuxu, případně android
edit: případně jak zeditovat naskenovaný pdf na nějaký funkční pdf, který by už pobral google překladač

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 2:44
od mstreicher
Dost dělám s AI. Takže já bych si na to udělal zvlášť Gpt nebo obdobný model, použil dokumenty jako "content source". Pak se můžeš přímo ptát.

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 3:47
od DwPetr
Tak jsem to teda konečně vyzkoušel a je to teda mazec :shock:

Návštěvník:
pomocí čeho přeložím naskenované pdf?


Editee:
Na překlad naskenovaného PDF souboru můžeš použít následující postup a nástroje:

1. **Optické rozpoznávání znaků (OCR)**: Nejprve je třeba převést naskenovaný dokument (který je obrázkem textu) na upravitelný text. K tomu lze použít programy jako:
- **Adobe Acrobat Pro DC** (má funkci OCR).
- **ABBYY FineReader** (velmi přesný OCR nástroj).
- **Google Drive + Google Dokumenty** (nahraj PDF na Google Disk, klikni pravým tlačítkem a vyber "Otevřít v Google Dokumentech" – Google použije OCR pro extrakci textu).
- **Online nástroje** jako [OnlineOCR](https://www.onlineocr.net/).

2. **Překlad extrahovaného textu**: Jakmile máš text z PDF, můžeš ho přeložit pomocí:
- **Google Překladač** (vložit text ručně nebo nahrát upravitelný dokument – podporuje Word nebo TXT).
- **DeepL Překladač** (doporučuje se pro přesnější překlady, podporuje i nahrání dokumentu ve formátu Word).
- **Microsoft Translator** nebo další překladatelské nástroje.

3. **Nahrání textu zpět do PDF**: Po překladu můžeš text vložit zpět do PDF pomocí:
- **Canva** nebo **Adobe Acrobat Pro** (pro přidání přeloženého textu a přizpůsobení rozvržení).
- **Online PDF editory** jako [PDFescape](https://www.pdfescape.com/) nebo [Sejda PDF Editor](https://www.sejda.com/).

Pokud je PDF již editovatelné (tj. text není obrázkem), můžeš krok 1 vynechat.


Návštěvník:
A zůstane mi stejné rozložení stránky?



Editee:
Udržení stejného rozložení stránky závisí na nástrojích, které použiješ, a také na tom, jak složitě je PDF původně formátováno (např. tabulky, obrázky, sloupce textu).

1. **OCR a rozložení**:
- Pokud použiješ kvalitní OCR nástroj, jako je **ABBYY FineReader** nebo **Adobe Acrobat Pro DC**, tyto programy se snaží zachovat formátování co nejpřesněji (rozložení textu, obrázky, tabulky apod.).
- U online OCR nástrojů (např. OnlineOCR nebo Google Dokumenty) je přesnost rozložení často nižší, zvláště pokud je PDF složitější.

2. **Překladový proces**:
- **DeepL** i **Google Překladač** umožňují nahrát formátované dokumenty (např. Word) a přeložit je. DeepL často lépe zachová původní rozložení ve srovnání s Google Překladačem.
- Přesto při překladu může dojít k posunu textu nebo rozbití formátování, protože délka vět se obvykle změní v závislosti na cílovém jazyce.

3. **Editace PDF po překladu**:
- Pokud chceš přesně zachovat původní rozložení, může být nutné ručně upravit výsledný dokument. Nástroje jako **Adobe Acrobat Pro DC** nebo **Canva** ti umožní přidat přeložený text zpět a přizpůsobit ho původnímu vzhledu.
- **Sejda PDF Editor** nebo **PDFescape** jsou vhodné, pokud nechceš používat prémiové programy, ale kvalita zachování formátování může být nižší.

### Doporučení:
Pokud je rozložení stránky pro tebe kriticky důležité:
- Použij **ABBYY FineReader** nebo **Adobe Acrobat Pro DC** pro OCR a překladový proces. Tyto nástroje mají pokročilé funkce pro zachování původního designu.
- Po překladu zkontroluj výstupní soubor a případně uprav rozložení manuálně.

U složitějších dokumentů je téměř nevyhnutelné, že budeš muset provádět drobné úpravy.


Návštěvník:
A je něco z toho free? nebo vše placené



Editee:
Naštěstí existují i **bezplatné možnosti** pro překlad naskenovaného PDF, i když některé placené nástroje nabízejí vyšší kvalitu a přesnost. Zde je přehled bezplatných nástrojů, které můžeš použít:

---

### **1. OCR (Převod naskenovaného textu na upravitelný formát)**
#### **Zdarma:**
- **Google Drive + Google Dokumenty**
- Nahraj PDF na svůj Google Disk.
- Klikni na PDF pravým tlačítkem myši > **Otevřít v Google Dokumentech**. Google automaticky použije OCR a převede text na upravitelný formát.
- *Poznámka:* Formátování nemusí být vždy perfektní, zvlášť u složitějších dokumentů.

- **OnlineOCR** ([onlineocr.net](https://www.onlineocr.net/))
- Jednoduchý a bezplatný online nástroj pro OCR. Podporuje PDF a několik jazyků.
- *Poznámka:* U bezplatné verze je omezený počet stran a u složitějších dokumentů může dojít ke ztrátě formátování.

- **Microsoft OneNote**
- Vlož PDF jako obrázek do OneNote, klikni pravým tlačítkem na obrázek a vyber **Kopírovat text z obrázku**. Tento text pak můžeš použít pro překlad.

#### **Placené (ale s trial verzí):**
- **Adobe Acrobat Pro DC** – Nabízí bezplatnou 7denní zkušební verzi.
- **ABBYY FineReader** – Poskytuje bezplatnou 30denní trial verzi.

---

### **2. Překlad extrahovaného textu**
#### **Zdarma:**
- **Google Překladač** ([translate.google.com](https://translate.google.com)):
- Můžeš vložit text ručně nebo nahrát dokument (např. ve Wordu). Překladač zvládne základní formátování, ale u složitějších dokumentů nemusí zachovat rozložení stránky.
- *Poznámka:* Překlad je rychlý, ale kvalita překladu nemusí být vždy ideální.

- **DeepL Překladač** ([deepl.com](https://www.deepl.com)):
- Bezplatná verze umožňuje vkládat text nebo nahrávat dokumenty (např. Word). DeepL obvykle lépe zachovává formátování a poskytuje kvalitnější překlady než Google Překladač.
- *Poznámka:* Bezplatná verze má omezení velikosti a podporuje jen některé formáty.

---

### **3. Návrat přeloženého textu zpět do PDF**
#### **Zdarma:**
- **Sejda PDF Editor** ([sejda.com](https://www.sejda.com)):
- Bezplatná verze umožňuje editovat PDF, přidat přeložený text a upravit rozložení. Má však omezení na 3 úlohy denně a maximální velikost souboru (50 MB).

- **PDFescape** ([pdfescape.com](https://www.pdfescape.com)):
- Online editor PDF zdarma umožňuje základní úpravy, jako je přidání textu na stávající PDF.
- *Poznámka:* Rozložení a formátování může být složitější upravit.

- **Canva** ([canva.com](https://www.canva.com)):
- Nahraj PDF do Canvy, přidej přeložený text a uprav si rozložení stránky. Canva je vhodná pro kreativnější úpravy.

#### **Placené (ale s trial verzí):**
- **Adobe Acrobat Pro DC** (7 dní zdarma).
- **ABBYY FineReader** (30 dní zdarma).

---

### **Shrnutí pro bezplatné řešení:**
1. **Pro OCR**: Použij **Google Drive** nebo **OnlineOCR**.
2. **Pro překlad**: Použij **DeepL** nebo **Google Překladač**.
3. **Pro úpravu PDF**: Použij **Sejda PDF Editor**, **PDFescape**, nebo **Canva**.

I když jsou placené nástroje často přesnější a pohodlnější, kombinací těchto bezplatných nástrojů můžeš dosáhnout dostatečně dobrého výsledku – jen to může vyžadovat trochu manuální práce s formátováním.

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 5:25
od Permonik
Přesně před měsícem se s tím taky tak drbal.

Nejlepší když to bylo švabachem.

Jinak mi se osvěčilo https://tools.pdf24.org/cs/vsechny-nastroje - PDF OCR - pokud to nejde z pdf prostým crtl+c.

A google translator, ale technické výrazy jsem si občas jmenovitě dopřekladaval.

Pokud to měla být cesta OCR+překlad, tak placené jsem nezkoušel. Jinak free bud nešlo a nebo bylo totalně rozhozené.

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 5:42
od DwPetr
Tak rady robota vyzkoušeny a výsledek čistá 0, vždycky se to na něčem zaseklo, buď to nezvládlo objem, nebo sken, nebo s tím nešlo hnout, nebo to přeložilo a výsledek pořád v AJ. Ještě bude třeba aby se ten vývoj trochu zdokonalil, což uznal i sám robot a přestal se se mnou bavit.

Nakonec jsem objevil překladač, který pojme naráz 500Mb, načte skenované pdf a zachová i rozložení. Je placený, a vychází to odhadem na 4,-Kč za stránku. https://otranslator.com/cs/translate

Takto to vypadá, nedělal jsem s tím nic, jen jsem to nahrál. Prvních 600 znaků je zdarma.
0-tektronix_7603_r7603-4.cs.pdf
(435.47 KiB) Staženo 83 x
Tak se to třeba bude někomu hodit.

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 6:48
od ok1in
Používám placený DeepL a dává to taky...

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 8:49
od r4cv
pred pár rokmi som prekladal návod na dielenský mikroskop. cca 28strán s obrázkami. zdroj bolo pekne naskenovaná príručka z x-tých rokov v PDF a podarilo sa mi to cez google translator. samozrejme bezplatne. ale za tie 4 roky sa situácia mohla zmeniť.

Re: Překlad skenovaných PDF

Napsal: 16. 12. 2024, 9:22
od DwPetr
No u mě je to problém, scan, který jen tak něco nepřečte, 210 stran, a velikost 160mb. Právě jsem si říkal, že kdybych narazil na funkční způsob, projel bych tím všechny manuály k motorům co mám :D Nicméně jsem to všechno vzal za špatný konec, půl dne se tady drbu s překladem manuálu, a přitom se stačí rovnou zeptat:

Návštěvník:
Mám podezření, že u Osciloskopu Tektronix 7603 nefunguje readout z důvodu neunkčnosti obvodu na pozici U2284, prohledej internetová fora, zda se problématický obvod U2284 / 155 0020 00 neobjevil při řešení tohoto problému, dík


Editee:
Jelikož nemám přímý přístup k internetu nebo fórům v reálném čase, nemohu provést aktuální vyhledávání. Nicméně na základě mé databáze a historických poznatků o osciloskopech Tektronix (včetně modelu 7603) vám mohu poskytnout informace, které by mohly pomoci.

---

### U2284 / 155-0020-00 na Tektronix 7603
Obvod **155-0020-00**, umístěný na pozici **U2284**, je známým problémovým prvkem v obvodech osciloskopů Tektronix ze 70. a 80. let. Tento obvod je zakázkový IC vyvinutý společností Tektronix a je často spojován s funkcemi **readoutu** (zobrazení textových nebo číselných informací na obrazovce). Závady tohoto obvodu bývají poměrně časté, protože se jedná o starší součástku, která byla vyrobena v omezeném množství a dnes již není běžně dostupná.

---

### Časté příčiny závad
1. **Stáří obvodu:**
- Poškození interní struktury IC způsobené teplotními cykly a degradací materiálů.
- Oxidace nebo špatný kontakt na nožičkách IC.

2. **Napájecí napětí:**
- Přepětí nebo kolísání napájecího napětí mohlo poškodit obvod. Tento obvod je obvykle napájen nízkým napětím (např. +5V), takže zkontrolujte stabilitu této větve.

3. **Závada v okolních obvodech:**
- Vadné součástky, jako jsou podpůrné rezistory, kondenzátory nebo tranzistory, mohou způsobit, že obvod nefunguje správně.

4. **Studené spoje:**
- Staré pájené spoje mohou být mechanicky oslabené nebo oxidované. Přepájení IC i okolních součástí může často problém vyřešit.

---

### Možná řešení
1. **Kontrola stavu IC:**
- Ověřte, zda je obvod **155-0020-00** mechanicky nepoškozený a zda jsou jeho vývody dobře připájené.
- Zkontrolujte napětí na napájecích pinech IC a porovnejte je s očekávanými hodnotami ze servisního manuálu.

2. **Zaměnitelné náhrady:**
- Bohužel, jelikož jde o zakázkový obvod, přímá náhrada neexistuje. Pokud je však funkce tohoto obvodu známa, je možné jej zrekonstruovat pomocí moderních součástek (např. použitím FPGA, TTL, nebo diskrétních komponent).
- Některá fóra zmiňují, že pro jiné modely Tektronix se podařilo obvod nahradit analogovými nebo digitálními IC, ale vyžaduje to podrobnou znalost schématu.

3. **Bazarové a specializované zdroje:**
- Hledejte originální obvod u specializovaných prodejců:
- [eBay](https://www.ebay.com) – někdy se zde objeví staré zásoby IC nebo celé moduly.
- [Sphere Research](http://www.sphere.bc.ca) – kanadský obchod, který se specializuje na staré díly Tektronix.
- [Donberg Electronics](https://www.donberg.ie) – nabízí zastaralé součástky, často na objednávku.

4. **Reverzní inženýrství:**
- Pokud je k dispozici schéma obvodu a funkce **155-0020-00** je známá, lze obvod nahradit novým návrhem na bázi moderních součástek. Toto řešení je však náročné a vyžaduje zkušenosti s návrhem a stavbou elektronických obvodů.

---

### Diskuse na fórech
Z historických dat a informací z fór, jako jsou například **EEVblog** nebo **TekWiki**, se problém s obvodem **155-0020-00** objevil v několika případech:

1. **EEVblog Forum:**
Existují diskuze o problémech s readout funkcí v osciloskopech Tektronix, kde byl problém často spojován s tímto obvodem. Někteří uživatelé řešili problém nákupem náhradních dílů z použitých osciloskopů nebo reverzním inženýrstvím.

2. **TekWiki:**
Na stránkách věnovaných Tektronix zařízením (např. [TekWiki](https://w140.com/tekwiki/wiki/Main_Page)) jsou podrobné informace o některých zakázkových IC včetně jejich funkcí. Pokud není přímo zmíněn **155-0020-00**, doporučuji stránku navštívit a hledat relace k Tektronix 7603.

3. **Antique Radio Forums a další sběratelská fóra:**
Na podobných fórech mohou být sběratelé nebo technici, kteří mají zkušenost s opravou tohoto modelu osciloskopu. Někdy nabízejí použité díly nebo alternativní řešení.

---

### Doporučený postup
1. **Najít schéma zapojení a popis obvodu**:
- Zkontrolujte servisní manuál osciloskopu Tektronix 7603, abyste zjistili, jakou funkci obvod **155-0020-00** plní.
- Pokud nemáte manuál, zkuste jej najít na stránkách jako:
- [Tektronix Manuals Online](http://w140.com/tekwiki/manuals.htm)
- [BAMA (Boat Anchor Manual Archive)](https://bama.edebris.com)

2. **Vyhledejte náhradní díl nebo celý modul**:
- Zkuste bazarové platformy (eBay, Aukro) nebo specializované prodejce (Sphere Research, Donberg Electronics).

3. **Kontaktujte komunitu**:
- Zeptejte se na fórech, jako jsou **EEVblog** nebo **Audioweb.cz**, zda někdo nemá zkušenost s opravou tohoto konkrétního problému.

4. **Reverzní inženýrství / oprava**:
- Pokud nic nepomůže, může být nutné rekonstruovat obvod pomocí moderních komponent. To je však složitější cesta a vhodná pro zkušené elektroniky.

---

Pokud byste potřeboval podrobnější informace o daném obvodu nebo pomoci s analýzou jeho funkce, dejte vědět! 😊

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 7:21
od mstreicher
Jo, GenAI (jakekoliv) neni o tom, jestli nekdo umi klikat na tlacitka. Je to o tom, jestli se umi ptat. A to bude dulezita schopnost i do budoucnosti.
DwPetr: Zkousel jsi to teda dat jako zdroj do nejakeho modelu nebo ne? Kdyztak napis, protoze mam jeste jeden napad, jak by se to dalo elegantne udelat.

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 7:59
od tiborius
Nazdar.

Zaujímavá téma.

Ja som sa tiež snažil free softom a výsledok taktiež nula. Teraz už to robím jednoduchšie, výsledok taký sparťanský ale zatiaľ som z návodov všetko vyčítal.

1 - vytlačím si PDF dokument v papierovej forme.
2 - Google prekladačom si v telefóne pomocou foťáku preložím stránku a obrázok si s prekladom nechám uložiť. Preloží tak 90 %.
3- stránky /obrázky/ si vytlačím a dopíšem ručne chýbajúce slová.

Tento spôsob je len na to dobrý aby som vedel pre seba nejaký presný návod. Aj tak potrebujem preložiť len nejaké riadenie alebo presné nastavenie. Nie celý návod, len časť.

Ak si niekto chce urobiť pekný návod komplet pekne v jemu vysnívanom jazyku tak ho sklamem.

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 4:03
od DwPetr
Mstreicher, pak pošlu SZ

Obecně ta AI, nebo Ei, nebo II, já jsem se tomu úplně vyhejbal, ale včera co jsem to zkusil začít používat mě to ohromilo. On to je v podstatě lepší vyhledávač, ale narozdil od googlu kde musím přesně specifikovat co hledám a pak se protloukat množstvím odkazů a banhnem v nich několik dní, tak tady se zeptám klidně jak jantar a dostanu výtah celým internetem... a to za pár vteřin...

Samozřejmě za předpokladu, že má robot z čeho čerpat. O elektronice, měřicí technice, různých nastavení, měření, jsem dozvěděl hodně. O H63 jsem se nedozvěděl nic :D

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 6:13
od lapa
DwPetr: jen bacha na situace, kdy si AI vymýšlí - ovšem nedělá to úmyslně (zatím :lol: ) - ovšem nesmysl podá stejně suverénně jako validní odpověď... takže tazatel musí být trošku v obraze, aby odpověď mohl posoudit...

Prostě se zjevně u některých lidí AI už stává autoritou se všemi důsledky (nemyslím tebe, aby nedošlo ke zmateni).

Jiná verze toho, co už známe "... vyjelo nám to z počítače, tedy musí to být pravda..."

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 6:23
od Charon
Skynet a T800 se holt blíží :lol:

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 7:20
od DwPetr
Já jsem knihovej, co mě zajímá tak si schraňuju, starý knížky.. S AI, vidím to stejně jak vy, ten robot přečte jen to, co je na netu, což může bejt i pěkná blbost, tu se ale můžeme dozvědět i od lidí.

To co v tom spatřuju za super věc, je to, že se můžu úplně přirozeně zeptat, v podstatě rozvést diskusi a robot je schopen v ní pokračovat, držet se tématu, nepošle mě do prdele, když se na stejnou věc zeptám 5x za sebou :D a ušetří mi při tom hledání plno času.

Zjistil jsem že u různých robotů je ruzný konec tréninku (u těch zdarma, placený nemám) takže když jsem se ptal na to překládání skenovaných pdf, tak měl konec začátkem roku 2023, takže dva roky starý informace, což dneska už je všechno jinak, proto mi moc nepomohl. Čekal jsem že mi napíše, tady mi to uploudni, za 2 minuty si to dojdi stáhnout.. :D

Ten osciloskop na něj byla trochu past, protože jsem to tejden před tím hledal a samozřejmě našel, ale mě to trvalo několik dní a pročítání všeho možnýho, on to udělal za pár vteřin a trefil se.

Takže já to beru jako vylepšenej Google vyhledávač, kterej mi najde to stejný jako bych si našel sám, akorát rychleji a předpokládám, že ze všech těch informací bude dělat nějaký průměr aby vyloučil hovadiny.

Diskutoval jsem s tím o elektronkách, osciloskopech, měření, nastavování zesilovačů..

Zkušeností s tím moc nemám, jsem spíš typem stará škola. A jestli existuje něco jako skynet netuším, ale pokud se mě dostane do ruk takováhle technologie, co asi mají vyvinutý armády... :D

Re: Překlad skenovaných PDF

Napsal: 17. 12. 2024, 7:53
od lapa
DwPetr píše: 17. 12. 2024, 7:20 ... co asi mají vyvinutý armády... :D
Pocitej radove jednotky let predstihu (ono se to zrychluje) a soucasne pocitej s "civily", kteri maji tendenci neposlouchat ... mam na mysli napr. Muska ... ale to obvykle resi(la) PEP pilulka :lol: ... viz Pohled spolecnosti Parallax ... "paranoidni" film ze sedmdesatek ...