cerhu > linux.debian.user.french

Fabrice Delvallée (29/05/2020, 14h00)
Bonjour la liste

J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver
l'encodage.

Extrait de la sortie de 'od -xc --endian=big'

0000000 5469 7472 6520 6f72 6967 696e 616c 0954
T i t r e o r i g i n a l \t T
0000020 6974 7265 2066 7261 6e8d 6169 7309 528e
i t r e f r a n 215 a i s \t R 216
0000040 616c 6973 6174 6575 7209 436f 756c 6575
a l i s a t e u r \t C o u l e u
0000060 7220 6574 2046 6f72 6d61 7409 416e 6e8e
r e t F o r m a t \t A n n 216
0000100 6520 6574 2050 6179 7309 5675 203f 2066
e e t P a y s \t V u ? f

Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é

J'ai tenté quelques commandes :

file -> data

file -bi -> application/octet-stream; charset=binary

chardetect -> Windows-1254 with confidence 0.549694044361

Ne trouvant pas l'encodage j'ai tenté de faire un peu de brute force :

for f in $(iconv --list); do c=$(echo "$f" | cut -d'/' -f 1); iconv -f
$c -t utf8 f.txt &> /dev/null | grep français && echo $c;done

donne rien, en revanche j'ai avec : for f in $(iconv --list); do
c=$(echo "$f" | cut -d'/' -f 1); iconv -f $c -t utf8 f.txt &> /dev/null
| grep fran??ais && echo $c;done

fran??ais
CP1256
fran??ais
CP9448
fran??ais
CSIBM9448
fran??ais
IBM-9448
fran??ais
IBM9448
fran??ais
MS-ARAB
fran??ais
WINDOWS-1256

Auriez-vous des pistes...
Haricophile (29/05/2020, 14h10)
Le Fri, 29 May 2020 13:46:30 +0200,
Fabrice Delvallée <fabrice.delvallee> a écrit :

> Auriez-vous des pistes...


Il date de quand ton fichier ?
Charles Plessy (29/05/2020, 14h20)
Le Fri, May 29, 2020 at 01:46:30PM +0200, Fabrice Delvallée a écrit :
> J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver
> l'encodage.


> Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é


https://www.google.com/search?q="ç" "8d" "é" "8e"

À la deuxième page, bingo :)

[..]

Amicalement,

Charles
bidons59 (29/05/2020, 14h20)
Je l'ai trouvé sur internet... 2001 peut être

Le 29/05/2020 à 14:00, Haricophile a écrit :
[..]
Fabrice Delvallée (29/05/2020, 14h50)
Bravo

Merci beaucoup

PS: j'utilise pas google :p

Le 29/05/2020 à 14:17, Charles Plessy a écrit :
[..]
Marc Chantreux (29/05/2020, 15h00)
salut,

autre façon de faire:

* j'ai demandé le fichier source à Fabrice
* j'ai vu que ca contenait un __MACOSX

du coup

icon -l|grep -iMAC

... essayons MACINTOSH ..

iconv -f MACINTOSH -t utf-8 fichier.txt

bingo ... par contre ca contient des ^U pour préfixer les urls donc

iconv -f MACINTOSH -t utf-8 fichier.txt | tr -d "^U" > final.txt

(le ^U s'obtient en tappant ctrl-v ctrl-u)

hth

marc
Charles Plessy (29/05/2020, 21h50)
Le Fri, May 29, 2020 at 02:44:12PM +0200, Fabrice Delvallée a écrit :
> PS: j'utilise pas google :p


J'évite aussi Google autant que possible...

DuckDuckGo a une syntaxe très pratique qui fait que quand on ajoute !g
dans le champ de recherche on renvoie la recherche chez Google. C'est
pratique quand DuckDuckGo a fait choux blanc.

[..]

Bonne journée,
Discussions similaires
recherche d'algo d'encodage de PATH (au sens Unix)

Recherche logiciel d'encodage audio pour KDE

encodage

pb d'encodage (pc->mac)


Fuseau horaire GMT +2. Il est actuellement 14h20. | Privacy Policy