Microsoft Windows Vista Community Forums - Vistaheads
Recommended Download



Welcome to the Microsoft Windows Vista Community Forums - Vistaheads, YOUR Largest Resource for Windows Vista related information.

You are currently viewing our boards as a guest which gives you limited access to view most discussions and access our other features. By joining our free community you will have access to post topics, communicate privately with other members (PM), respond to polls, upload content and access many other special features. Registration is fast, simple and absolutely free so , join our community today!

If you have any problems with the registration process or your account login, please contact us.

Driver Scanner

Soucis Unicode & table de caractères

microsoft.public.fr.windows.vista.general






Speedup My PC
Reply
  #1 (permalink)  
Old 02-05-2008
MCI \(ex do ré Mi chel la si do\) [MVP]
 

Posts: n/a
Soucis Unicode & table de caractères
Bonsoir !

Regardez donc la pièce jointe (ci-dessous).

La frappe "Alt+0156" donne le caractère marqué comme U+0153 (0x9C).
Or hex(153) = 0x99

Quelqu'un pourrait-il m'éclairer sur la signification de ce truc ?

Merci d'avance
--
Michel Claveau

Reply With Quote
Sponsored Links
  #2 (permalink)  
Old 02-06-2008
mdnews
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Tue, 5 Feb 2008 23:54:49 +0100, "MCI \(ex do ré Mi chel la si do\)
[MVP]" <enleverlesO.OmcO@OmclaveauO.com> >>


>Regardez donc la pièce jointe (ci-dessous).
>
>La frappe "Alt+0156" donne le caractère marqué comme U+0153 (0x9C).
>Or hex(153) = 0x99
>
>Quelqu'un pourrait-il m'éclairer sur la signification de ce truc ?



« oe collé » (utilisé normalement dans les mots tels que coeur, oeil
etc). Pose un tas de problèmes en informatique (par exemple dans les
bases de données médicales où on en trouve plein) c'est pour cela
qu'on l'utilise peu.
Où est le problème ?
(ou alors j'ai mal compris la question :-?
Reply With Quote
  #3 (permalink)  
Old 02-06-2008
Jean-Claude BELLAMY
 

Posts: n/a
Re: Soucis Unicode & table de caractères
"MCI (ex do ré Mi chel la si do) [MVP]" <enleverlesO.OmcO@OmclaveauO.com> a
écrit dans le message de news:uwV5hoEaIHA.3652@TK2MSFTNGP02.phx.gbl...
> Bonsoir !
>
> Regardez donc la pièce jointe (ci-dessous).
>
> La frappe "Alt+0156" donne le caractère marqué comme U+0153 (0x9C).

NANNNNNNNNNNNN !
Je ne sais pas ou tu as fait cette capture d'écran, ou si tu l'as bricolée
(;-) ), mais c'est FAUX !
Ce qui suit le "U" est déjà en HEXADÉCIMAL !!!!!
Ce "(0x9C)" est aberrant !
Il eût fallu écrire :
U+0153 (339 décimal)

LA PREUVE : remonte un peu en arrière, et tu verras :
"e dans l'o minuscule" : 0153
"e dans l'o majuscule" : 0152
"o minuscule double accent" : 0151
"o majuscule double accent" : 0150
"o minuscule brève" : 014F <-- le doute n'est plus possible !
"o majuscule brève" : 014E
"o minuscule macron" : 014D
...

Tu as été "enduit plein d'erreur" par la proximité VISUELLE entre
le "0156", qui est la séquence de frappe au pavé numérique,
à savoir les chiffres décimaux 0-1-5-6
et
le RANG UNICODE du caractère exprimé en hexadécimal 0153
!


> Quelqu'un pourrait-il m'éclairer sur la signification de ce truc ?



La frappe d'un caractère via le pavé numérique (avec une séquence ALT 0xxx)
n'est disponible que pour un nombre RESTREINT de caractères, à savoir 255
(en réalité moins, vu que les codes 0 à 31 sont des caractères de contrôle).

P.ex. si on tape ALT+0333, on obtient la lettre "M", ce qui s'explique
facilement : 333 est égal en hexa à 0x14D, et comme un masque ne conserve
que l'octet de poid faible, il est retenu 0x4D, qui est bien le code ANSI
(Latin-1) de la lettre M.

Comme il y a beaucoup plus de caractères UNICODE (en théorie 65535), il NE
PEUT PAS y avoir correspondance biunivoque entre la valeur UNICODE d'un
caractère (plage de 65535 au max) et la valeur que l'on peut taper au pavé
numérique (plage de 255 au max)
NB: en réalité, en raison de l'existence d'autres "plans" UNICODE, on
dépasse actuellement le million de codes différents.

Un grand nombre de caractères UNICODE ne sont pas "tapables" (néologisme !)
au pavé numérique ...

Il n'y a correspondance entre code UNICODE et code ASCII que pour les 127
1ers caractères !
Ainsi, la lettre "A majuscule" a pour code UNICODE U+0041, soit 65 en
décimal, et on peut effectivement la taper au pavé numérique par la séquence
ALT+065.
Cela est un cas évidemment trivial, vu que la touche "A" existe.

Déjà pour les 128 caractères suivants (donc entre UNICODE et ANSI, sur 8
bits) il y a des différences.
Cela est dû, entre autres, au fait que les valeurs UNICODE comprises entre
0x80 et 0x9F ne sont pas utilisées, alors qu'elles le sont en ANSI (8 bits)
!
NB : Je n'ai trouvé nulle part la raison d'être de cette plage non-utilisée
en UNICODE.
P.ex. dans cette plage "non utilisée" en UNICODE, on trouve en ANSI le
fameux "o" (code 0x9C/156), qui se trouve "renvoyé" en UNICODE dans le bloc
"Latin étendu A" (voir plus bas) (code 0x153/339)

Entre 0x9F et 0xFF on retrouve la correspondance
P.ex. le "Ç" (c cédille majuscule), non prévu sur un clavier AZERTY, est
obtenu par la séquence ALT+0199
Et son code UNICODE U+00C7 vaut bien la même chose en décimal : 199


Enfin, bien évidemment, il ne peut y avoir aucune correspondance possible
pour tous les caractères au delà du 256ème.


On a défini en UNICODE plusieurs "blocs", ainsi dénommés :

0x0000 à 0x007F Latin de base (identique à ASCII, sur 7 bits)
0x0080 à 0x009F Non-utilisé (Utilisé en ANSI, sur 8 bits)
0x00A0 à 0x00FF Supplément Latin-1
0x0100 à 0x017F Latin étendu A
0x0180 à 0x024F Latin étendu B
0x0250 à 0x02AF Alphabet phonétique international
0x02B0 à 0x02FF Lettres modificatives avec chasse
0x0300 à 0x036F Diacritiques
....





PS : j'ai beaucoup simplifié, et certains puristes risquent de hurler.
Mais je n'avais pas l'intention (ni le temps) ici de détailler ni la norme
ASCII ISO/CEI 646, ni la norme UNCODE ISO/CEI 10646, ni les différences
entre UTF8, UTF16, ...

--
May the Force be with You!
La Connaissance s'accroît quand on la partage
----------------------------------------------------------
Jean-Claude BELLAMY [MVP] - http://www.bellamyjc.org

Reply With Quote
  #4 (permalink)  
Old 02-06-2008
Nikita
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Salut,

en fait, x9C est le code hexa de 0156.

Dans Word, tu peux faire le test suivant. Tape
153 suivi immédiatement de ALT C
et sur la ligne suivante
x9C suivi immédiatement de ALT C
dans les 2 cas, tu obtiendras ½

Si tu retapes ALT C avec le curseur juste à droite de ce caractère,
dans les 2 cas tu auras 0153.
Ton logiciel t'indique que les 2 codes sont équivalents. C'est
simplement pas très bien présenté.

Niki


> Bonsoir !
>
> Regardez donc la pièce jointe (ci-dessous).
>
> La frappe "Alt+0156" donne le caractère marqué comme U+0153 (0x9C).
> Or hex(153) = 0x99
>
> Quelqu'un pourrait-il m'éclairer sur la signification de ce truc ?
>
> Merci d'avance


--
Niki


Reply With Quote
  #5 (permalink)  
Old 02-06-2008
galida
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Bonjour, et merci pour la démonstration.
--
Daniel - galida


Reply With Quote
  #6 (permalink)  
Old 02-06-2008
MCI \(ex do ré Mi chel la si do\) [MVP]
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Re !

> Ton logiciel t'indique que les 2 codes sont équivalents. C'est
> simplement pas très bien présenté.


Le "logiciel" en question, c'est la table de caractères de Windows.
ça se présente aussi bien sous Vista que sous XP.

Le problème, c'est : pourquoi, lorsqu'on tape [Alt]+0156, on obtient
le caractère Unicode 0153 ?


@-salutations
--
Michel Claveau






Reply With Quote
  #7 (permalink)  
Old 02-06-2008
MCI \(ex do ré Mi chel la si do\) [MVP]
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Salut !

>> La frappe "Alt+0156" donne le caractère marqué comme U+0153 (0x9C).


> NANNNNNNNNNNNN !
> Je ne sais pas ou tu as fait cette capture d'écran, ou si tu l'as
> bricolée (;-) ), mais c'est FAUX !


Cette copie d'écran vient de la "table de caractères" de Windows (Vista
ou XP). Il faut cocher "Affichage Avancé", en bas à gauche.

Quand tu dis "c'est faux", c'est bien ce que je pensais, et c'est mon
soucis.

à noter que cela se produit aussi bien en sélectionnant "Unicode" que
"Windows occidental".

Enfin, l'affichage de la barre d'état est un peu différent, selon que
l'on clique que un caractère, ou que l'on saisisse, dans le champ :
[Alt]+0156


@+

Michel Claveau


Reply With Quote
  #8 (permalink)  
Old 02-06-2008
MCI \(ex do ré Mi chel la si do\) [MVP]
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Bonjour !

La dénomination exacte du caractère est :
"Digramme soudé minuscule latin OE"

Mais, ce n'est pas le problème. Ma question, c'est plutôt le décalage
d'information affiché par la "table de caractères".

@+

Michel Claveau


Reply With Quote
  #9 (permalink)  
Old 02-06-2008
MCI \(ex do ré Mi chel la si do\) [MVP]
 

Posts: n/a
Re: Soucis Unicode & table de caractères
Bonjour !

> la démonstration.


La démonstration de quoi ? Voir la table de caractères...

@+

Michel Claveau

Reply With Quote
  #10 (permalink)  
Old 02-06-2008
mdnews
 

Posts: n/a
Re: Soucis Unicode & table de caractères
On Wed, 6 Feb 2008 17:11:18 +0100, "MCI \(ex do ré Mi chel la si do\)
[MVP]" <enleverlesO.OmcO@OmclaveauO.com> wrote:


>Mais, ce n'est pas le problème. Ma question, c'est plutôt le décalage
>d'information affiché par la "table de caractères".


Désolé, j'avais lu trop vite ;-)

Si on utilise une autre table de caractère
(celle intégrée à EdipadPro par exemple)
on obtient ceci:

http://cjoint.com/data/cgrOXo3h6Y.htm

Reply With Quote
Reply


Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

vB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Trackbacks are On
Pingbacks are On
Refbacks are Off

Similar Threads
Thread Thread Starter Forum Replies Last Post
caracteres raros ulises microsoft.public.es.windowsvista 0 06-15-2007 22:25




All times are GMT +1. The time now is 11:49.




Driver Scanner - Free Scan Now

Vistaheads.com is part of the Heads Network. See also XPHeads.com , Win7Heads.com and Win8Heads.com.


Design by Vjacheslav Trushkin for phpBBStyles.com.
Powered by vBulletin® Version 3.6.7
Copyright ©2000 - 2014, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.6.0 RC 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120