OldComp.cz
http://oldcomp.cz/

Převod TXT soboru do 8bit binárky
http://oldcomp.cz/viewtopic.php?f=113&t=8418
Stránka 23

Autor:  faraon [ 30.03.2020, 22:26 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Base64 se komprimuje blbě, nedávno to někdo řešil myslím na ABClinuxu a prostě to nejde.

Autor:  PotPalo [ 31.03.2020, 00:17 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

No, pospájané (snáď som sa nepomýlil), ale čo s tým ďalej?

Přílohy:
output.rar [225.34 KiB]
422 krát

Autor:  Busy [ 31.03.2020, 00:23 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

PotPalo píše:
Vidno, ako funguje RAR kompresia v tomto prípade.
Ako funguje ?

Autor:  faraon [ 31.03.2020, 00:31 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Aha, PotPalo byl rychlejší. Tak jsem to porovnal s mým výsledkem a vyšlo mi totéž (s ohledem na hodinu jsem si také nebyl jistý správností), ale nevidím v tom nic smysluplného.

Autor:  PotPalo [ 31.03.2020, 00:38 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Busy píše:
PotPalo píše:
Vidno, ako funguje RAR kompresia v tomto prípade.
Ako funguje ?

Veď vidíš. Vidí to že vrchné dva bity sú vždy nula, tak ich vypustí. Skrátka prekombinuje 6 bit do 8 bit, v podstate to isté čo robíme my. Teda podľa veľkosti komprimovaného súboru to tak vyzerá. Ostatné dáta sú už zrejme komprimované alebo zašifrované, tam toho už ani RAR veľa nedá.

Ešte ma napadá, že to robíme možno zle. Predpokladáme vstup 00AAAAAA 00AABBBB 00BBBBCC 00CCCCCC, ale čo keď je to napríklad 00AAAAAA 00BBBBBB 00CCCCCC 00AABBCC ? S tým, že v tom poslednom "doplnkovom" byte môžu byť chýbajúce dva ľavé bity, alebo to celé posunie vľavo a doplnia sa dva bity vpravo. Alebo môže byť doplnkový byt ten prvý. Alebo ... Tých alebo môže byť naozaj veľa.

Tiež mi pripadá divné, že v jednom riadku by bolo zakódovaných 57 bytov. Možno je to 56 a posledný je CRC alebo kľúč...

Autor:  faraon [ 31.03.2020, 01:23 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Ono to Base64 se také defaultně zalamuje po 76 znacích. Akorát ta znaková sada mu neodpovídá.

Autor:  PotPalo [ 31.03.2020, 01:54 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Ako viem, či je to správne, má tam byť niekde čitateľný text?
Prikladám ešte dva spôsoby. Prvý spôsob je že v 4.byte sú bity 7 a 6 z prvých troch, druhý spôsob je že v 4.byte sú bity 1 a 0 z prvých troch, vždy v poradí 00112233.

Přílohy:
outputs_abc76_abc10.rar [451.91 KiB]
394 krát

Autor:  PotPalo [ 31.03.2020, 02:10 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Neuniká mi niečo? Trochu som pátral o base64. V podstate 64 znakov, čiže 6-bit. Trochu počítania: veľké písmená+malé písmená+číslice, to je 26+26+10=62, takže ešte dva špeciálne znaky. Ale na tom obrázku vidím okrem veľkých a malých písmen a číslic ešte viac ako dva znaky, je tam rýchlym pohľadom minimálne 10 znakov. Záhada?

edit: ako tak na to pozerám, používa to:
A-Z (41h-5Ah)
a-o (61h-6Fh)
0-9 (30h-39h)
+13 znakov

Takže trik je v tom, že to ide iba po o a nie až po z. Ma to zblblo, no noc, čo už. :mrgreen:
A hneď ma napadlo, čo keď to nejde práve v takom poradí ako to je? Napríklad tu: https://stackoverflow.com/questions/486 ... d-use-case je poradie veľké+malé+číslice+znaky. V ASCII je ale číslice+veľké+malé a znaky sú všade medzi tým. Čo keď je to aj tu poprehadzované a neplatí že @=0, A=1, B=2...
...Different decode table for base64

Autor:  microlan [ 31.03.2020, 05:14 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Díky za zájem, pánové!

Za chvíli na to mrknu. Myslím, že by tam měl být text, je to česká mutace FW

Autor:  microlan [ 31.03.2020, 06:32 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Ono to jde po RS232 do přístroje asi v té TXT formě a teprve tam se to nějak převádí a ukládá. Navíc to asi bude nějak zakódovaný. Jdu od toho, snad se výrobce probudí a dodá novou mutaci. Ještě jednou dík za pomoc.

Autor:  Busy [ 31.03.2020, 09:08 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

PotPalo píše:
...Different decode table for base64
Tych typov kodovania binarok do ascii je viac typov (napr. ja som kedysi hodne vyuzival uuencode).

Autor:  microlan [ 31.03.2020, 09:37 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

O vlastní kódování snad nejde, mám redukovaná 7-bitová data v souboru a jak se zrovna zobrazují, je snad jedno, ne? Důležité jsou významné bity, kterých je šest a můžu z nich sestavit 24-bitová slova, které pak rozdělím do 8-bitů. Jenže výsledek je asi ještě nějak kódovaný, v tomto případě

Autor:  Busy [ 31.03.2020, 11:27 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

PotPalo píše:
Busy píše:
PotPalo píše:
Vidno, ako funguje RAR kompresia v tomto prípade.
Ako funguje ?
Veď vidíš. Vidí to že vrchné dva bity sú vždy nula, tak ich vypustí. Skrátka prekombinuje 6 bit do 8 bit, v podstate to isté čo robíme my. Teda podľa veľkosti komprimovaného súboru to tak vyzerá.
Ako koduje base64 to viem, moja otazka smerovala skor na samotnu RAR kompresiu. Ale to je uz asi mimo tejto temy.

Autor:  Busy [ 31.03.2020, 11:36 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

microlan píše:
Důležité jsou významné bity, kterých je šest a můžu z nich sestavit 24-bitová slova, které pak rozdělím do 8-bitů.
Kolko roznych znakov je v tom textovom subore ? Ak viac ako 64 tak to kludne moze fungovat tak, ze to vyuziva celu ascii sadu (96 znakov bez medzery) a v tom pripade na kodovanie 4 bajtov staci 5 znakov, co je efektivnejsie nez base64 s iba 64 pouzitymi znakmi.

Autor:  danhard [ 31.03.2020, 12:34 ]
Předmět příspěvku:  Re: Převod TXT soboru do 8bit binárky

Blok tvoří 76 ASCII znanků 30h - 6Fh, zakončené 0Dh, 0Ah (CR, LF).

Pěkně se to zobrazí na 80-ti znakovém monitoru :D

Stránka 23 Všechny časy jsou v UTC + 1 hodina [ Letní čas ]
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/