Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Previous Topic Next Topic
 
classic Classic list List threaded Threaded
15 messages Options
Reply | Threaded
Open this post in threaded view
|

Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Eric Debeau
Bonsoir

Je corrige les erreurs détectées par Osmose et je suis tombé sur un cas intéressant. Certains noms de commerce intègrent des caractères non présents dans l'alphabet français. Par exemple: "Özgür Kebab Grill", sur le noeud: https://www.openstreetmap.org/node/818781604

Quelle est la règle à appliquer ?
Doit-on considérer que c'est un faux positif ?

Cordialement

Eric

_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Bibi
Bonjour, ici la réponse est évidente : c'est un faux positif.

Le nom est probablement turc ici et utilise le jeu de caractères turc,
c'est parfaitement normal.

La règle c'est que normalement les caractères des noms en français
n'utilisent que quelques caractères, avec des batailles juridiques pour
savoir si le ñ - n tiltre abusivement nommé n tilde du fait de son usage
courant en espagnol et désuet en français - est français ou pas.
https://www.argedour.bzh/titulus-tiltre-tilde-aux-origines-du-n/

Les noms de commerces n'ont pas sauf erreur à subir les fourches
caudines d'une administration au regard parfois étroit.

Donc le test est bon et c'est ici un faux positif.

Ce genre de tests est important j'ai vu des références en russe notées V
(par latinisation du cyrillique) et B (la lettre qui ressemble à un un B
mais qui se prononce V) : B (la lettre latine) aurait été incorrecte.

Jean-Yvon

Le 16/01/2021 à 20:02, Eric Debeau - [hidden email] a écrit :

> Bonsoir
>
> Je corrige les erreurs détectées par Osmose et je suis tombé sur un
> cas intéressant.Certains noms de commerce intègrent des caractères non
> présents dans l'alphabet français. Par exemple: "Özgür Kebab Grill",
> sur le noeud:https://www.openstreetmap.org/node/818781604
> <https://www.openstreetmap.org/node/818781604>
>
> Quelle est la règle à appliquer ?
> Doit-on considérer que c'est un faux positif ?
>
> Cordialement
>
> Eric
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr


_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Eric Debeau
Merci pour la clarification

Pour les noms des rues, il en existe beaucoup avec des ñ en Bretagne. Donc, idem, à considérer comme un faux positif ?

Eric

On Sat, Jan 16, 2021 at 9:58 PM <[hidden email]> wrote:
Bonjour, ici la réponse est évidente : c'est un faux positif.

Le nom est probablement turc ici et utilise le jeu de caractères turc,
c'est parfaitement normal.

La règle c'est que normalement les caractères des noms en français
n'utilisent que quelques caractères, avec des batailles juridiques pour
savoir si le ñ - n tiltre abusivement nommé n tilde du fait de son usage
courant en espagnol et désuet en français - est français ou pas.
https://www.argedour.bzh/titulus-tiltre-tilde-aux-origines-du-n/

Les noms de commerces n'ont pas sauf erreur à subir les fourches
caudines d'une administration au regard parfois étroit.

Donc le test est bon et c'est ici un faux positif.

Ce genre de tests est important j'ai vu des références en russe notées V
(par latinisation du cyrillique) et B (la lettre qui ressemble à un un B
mais qui se prononce V) : B (la lettre latine) aurait été incorrecte.

Jean-Yvon

Le 16/01/2021 à 20:02, Eric Debeau - [hidden email] a écrit :
> Bonsoir
>
> Je corrige les erreurs détectées par Osmose et je suis tombé sur un
> cas intéressant.Certains noms de commerce intègrent des caractères non
> présents dans l'alphabet français. Par exemple: "Özgür Kebab Grill",
> sur le noeud:https://www.openstreetmap.org/node/818781604
> <https://www.openstreetmap.org/node/818781604>
>
> Quelle est la règle à appliquer ?
> Doit-on considérer que c'est un faux positif ?
>
> Cordialement
>
> Eric
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr


_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr

_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Bibi
Il est parfaitement normal s'il s'agit d'un nom de personne bretonne
qu'il comporte un tiltre/tilde.

Par exemple Yann-Fañch Kemener,
https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener.

Pour les autres noms certains ont été francisés et ont perdu leur tilde :

https://www.openstreetmap.org/relation/296204

name <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr>
Roscanvel
name:br <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr>
Roskañvel

D'autres l'ont conservé voir retrouvé.

Donc à passer en faux positif. Sauf éventuellement s'il n'y pas pas de
name:br, dans ce cas il peut valoir le coup de demander au contributeur
si c'est le name ou le name:br.

Jean-Yvon

Le 17/01/2021 à 21:17, Eric Debeau - [hidden email] a écrit :
> Merci pour la clarification
>
> Pour les noms des rues, il en existe beaucoup avec des ñ en Bretagne.
> Donc, idem, à considérer comme un faux positif ?
>
> Eric


_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Frédéric Rodrigo-2
Si besoin on peut définir dans Osmose un alphabet alternatif pour
certain départements, on en a déjà :
https://github.com/osm-fr/osmose-backend/blob/master/modules/languages.py#L47-L50


Le 17/01/2021 à 21:44, [hidden email] a écrit :

> Il est parfaitement normal s'il s'agit d'un nom de personne bretonne
> qu'il comporte un tiltre/tilde.
>
> Par exemple Yann-Fañch Kemener,
> https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener.
>
> Pour les autres noms certains ont été francisés et ont perdu leur tilde :
>
> https://www.openstreetmap.org/relation/296204
>
> name <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr>
> Roscanvel
> name:br <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr>
> Roskañvel
>
> D'autres l'ont conservé voir retrouvé.
>
> Donc à passer en faux positif. Sauf éventuellement s'il n'y pas pas de
> name:br, dans ce cas il peut valoir le coup de demander au contributeur
> si c'est le name ou le name:br.
>
> Jean-Yvon
>
> Le 17/01/2021 à 21:17, Eric Debeau - [hidden email] a écrit :
>> Merci pour la clarification
>>
>> Pour les noms des rues, il en existe beaucoup avec des ñ en Bretagne.
>> Donc, idem, à considérer comme un faux positif ?
>>
>> Eric
>
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Eric Debeau
Bonne idée.

Je peux proposer une change request, mais peux tu clarifier comment suffixer la langue: "fr_XX"
fr_PF: correspond à quoi ?

L'idée serait de mettre au moins pour les 5 départements historiques.
Faut valider la liste des caractères avec Romain, Christian et les spécialistes de la langue bretonne.

Eric

On Sun, Jan 17, 2021 at 10:26 PM Frédéric Rodrigo <[hidden email]> wrote:
Si besoin on peut définir dans Osmose un alphabet alternatif pour
certain départements, on en a déjà :
https://github.com/osm-fr/osmose-backend/blob/master/modules/languages.py#L47-L50


Le 17/01/2021 à 21:44, [hidden email] a écrit :
> Il est parfaitement normal s'il s'agit d'un nom de personne bretonne
> qu'il comporte un tiltre/tilde.
>
> Par exemple Yann-Fañch Kemener,
> https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener.
>
> Pour les autres noms certains ont été francisés et ont perdu leur tilde :
>
> https://www.openstreetmap.org/relation/296204
>
> name <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr>
> Roscanvel
> name:br <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr>
> Roskañvel
>
> D'autres l'ont conservé voir retrouvé.
>
> Donc à passer en faux positif. Sauf éventuellement s'il n'y pas pas de
> name:br, dans ce cas il peut valoir le coup de demander au contributeur
> si c'est le name ou le name:br.
>
> Jean-Yvon
>
> Le 17/01/2021 à 21:17, Eric Debeau - [hidden email] a écrit :
>> Merci pour la clarification
>>
>> Pour les noms des rues, il en existe beaucoup avec des ñ en Bretagne.
>> Donc, idem, à considérer comme un faux positif ?
>>
>> Eric
>
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr

_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Frédéric Rodrigo-2
Oui, merci de faire un PR.
C'est ensuite référencé comme ça
https://github.com/osm-fr/osmose-backend/blob/master/osmose_config.py#L536

Le 17/01/2021 à 22:43, Eric Debeau a écrit :

> Bonne idée.
>
> Je peux proposer une change request, mais peux tu clarifier comment
> suffixer la langue: "fr_XX"
> fr_PF: correspond à quoi ?
>
> L'idée serait de mettre au moins pour les 5 départements historiques.
> Faut valider la liste des caractères avec Romain, Christian et les
> spécialistes de la langue bretonne.
>
> Eric
>
> On Sun, Jan 17, 2021 at 10:26 PM Frédéric Rodrigo
> <[hidden email] <mailto:[hidden email]>> wrote:
>
>     Si besoin on peut définir dans Osmose un alphabet alternatif pour
>     certain départements, on en a déjà :
>     https://github.com/osm-fr/osmose-backend/blob/master/modules/languages.py#L47-L50
>     <https://github.com/osm-fr/osmose-backend/blob/master/modules/languages.py#L47-L50>
>
>
>     Le 17/01/2021 à 21:44, [hidden email]
>     <mailto:[hidden email]> a écrit :
>     > Il est parfaitement normal s'il s'agit d'un nom de personne bretonne
>     > qu'il comporte un tiltre/tilde.
>     >
>     > Par exemple Yann-Fañch Kemener,
>     > https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener
>     <https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener>.
>     >
>     > Pour les autres noms certains ont été francisés et ont perdu
>     leur tilde :
>     >
>     > https://www.openstreetmap.org/relation/296204
>     <https://www.openstreetmap.org/relation/296204>
>     >
>     > name <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr
>     <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr>>
>     > Roscanvel
>     > name:br
>     <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr
>     <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr>>
>     > Roskañvel
>     >
>     > D'autres l'ont conservé voir retrouvé.
>     >
>     > Donc à passer en faux positif. Sauf éventuellement s'il n'y pas
>     pas de
>     > name:br, dans ce cas il peut valoir le coup de demander au
>     contributeur
>     > si c'est le name ou le name:br.
>     >
>     > Jean-Yvon
>     >
>     > Le 17/01/2021 à 21:17, Eric Debeau - [hidden email]
>     <mailto:[hidden email]> a écrit :
>     >> Merci pour la clarification
>     >>
>     >> Pour les noms des rues, il en existe beaucoup avec des ñ en
>     Bretagne.
>     >> Donc, idem, à considérer comme un faux positif ?
>     >>
>     >> Eric
>     >
>     >
>     > _______________________________________________
>     > Talk-fr mailing list
>     > [hidden email] <mailto:[hidden email]>
>     > https://lists.openstreetmap.org/listinfo/talk-fr
>     <https://lists.openstreetmap.org/listinfo/talk-fr>
>
>
>
>     _______________________________________________
>     Talk-fr mailing list
>     [hidden email] <mailto:[hidden email]>
>     https://lists.openstreetmap.org/listinfo/talk-fr
>     <https://lists.openstreetmap.org/listinfo/talk-fr>
>
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Philippe Verdy
In reply to this post by Eric Debeau
"fr-PF" pour BCP47 signifie la langue française telle que parlée/écrite en Polynésie française ("PF": pas un code de langue mais un code de région géographique issu de ISO 3166-1)
Normalement les code BCP47 n'ont pas de casse significative, et le "_" et le "-" sont équivalents.

Cependant dans OSM on n'utilise que les formes canoniques des identifiants de langue BCP47 (minuscules partout sauf pour les codes région à 2 lettres de l'ISO 3166-1 considérés comme quasi-obsolètes pour cet usage depuis l'arrive de l'ISO 639-3 qui a codé plein de langues uniques à 3 lettres qui auparavant étaient "réunies" sous un même code à 2 lettres ISO 639-1 ou -2 pour une "macrolangue", voire parfois toute une famille (désormais dans ISO 639-5; l'autre exception étant les codes d'écritures ISO 15924 à 4 lettres dont la forme canonique n'a que la première lettre en initiale; tout le reste étant en minuscule, les sous-labels composés de 1 à 8 lettres ou chiffres étant séparés "canoniquement" par un "-").

je ne vois pas quel usage peut avoir "fr-PF" en Polynésie française (cela ne peut pas désigner même les langues polynésiennes, ni des créoles à base de javanais ou d'autres langues austronésiennes, qui ont leur propre code ISO 639-3 à 3 lettres; les créoles de français ou d'anglais et de javanais ne sont pas des dialectes régionaux du français; il y a éventuellement un parler "caldoche" en Nouvelle-Calédonie, ayant conservé des formes régionales du français d'oil d'origine normande, mais le français standard s'est imposé depuis longtemps et les dialectes se sont perdus même avec les populations migrantes venues d'autres régions d'outre-mer ou ancienne colonies françaises d'Afrique et d'Asie du sud-est, ou migrants venus de ces pays devenus indépendants depuis : il n'y a pas de variété régionale réellement autochtone du français en Polynésie, les langues autochtones étant presque toutes austronésiennes ou d'une ancienne origine formosane, voire chinoise moderne bien plus récemment en même temps que les autres colonisations modernes).
 

Le dim. 17 janv. 2021 à 22:45, Eric Debeau <[hidden email]> a écrit :
Bonne idée.

Je peux proposer une change request, mais peux tu clarifier comment suffixer la langue: "fr_XX"
fr_PF: correspond à quoi ?

L'idée serait de mettre au moins pour les 5 départements historiques.
Faut valider la liste des caractères avec Romain, Christian et les spécialistes de la langue bretonne.

Eric

On Sun, Jan 17, 2021 at 10:26 PM Frédéric Rodrigo <[hidden email]> wrote:
Si besoin on peut définir dans Osmose un alphabet alternatif pour
certain départements, on en a déjà :
https://github.com/osm-fr/osmose-backend/blob/master/modules/languages.py#L47-L50


Le 17/01/2021 à 21:44, [hidden email] a écrit :
> Il est parfaitement normal s'il s'agit d'un nom de personne bretonne
> qu'il comporte un tiltre/tilde.
>
> Par exemple Yann-Fañch Kemener,
> https://fr.wikipedia.org/wiki/Yann-Fa%C3%B1ch_Kemener.
>
> Pour les autres noms certains ont été francisés et ont perdu leur tilde :
>
> https://www.openstreetmap.org/relation/296204
>
> name <https://wiki.openstreetmap.org/wiki/FR:Key:name?uselang=fr>
> Roscanvel
> name:br <https://wiki.openstreetmap.org/wiki/FR:Key:name:br?uselang=fr>
> Roskañvel
>
> D'autres l'ont conservé voir retrouvé.
>
> Donc à passer en faux positif. Sauf éventuellement s'il n'y pas pas de
> name:br, dans ce cas il peut valoir le coup de demander au contributeur
> si c'est le name ou le name:br.
>
> Jean-Yvon
>
> Le 17/01/2021 à 21:17, Eric Debeau - [hidden email] a écrit :
>> Merci pour la clarification
>>
>> Pour les noms des rues, il en existe beaucoup avec des ñ en Bretagne.
>> Donc, idem, à considérer comme un faux positif ?
>>
>> Eric
>
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr

_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

France mailing list
Le 18/01/2021 à 01:37, Philippe Verdy a écrit :

> "fr-PF" pour BCP47 signifie la langue française telle que
> parlée/écrite en Polynésie française ("PF": pas un code de langue mais
> un code de région géographique issu de ISO 3166-1)
> Normalement les code BCP47 n'ont pas de casse significative, et le "_"
> et le "-" sont équivalents.
>
> Cependant dans OSM on n'utilise que les formes canoniques des
> identifiants de langue BCP47 (minuscules partout sauf pour les codes
> région à 2 lettres de l'ISO 3166-1 considérés comme quasi-obsolètes
> pour cet usage depuis l'arrive de l'ISO 639-3 qui a codé plein de
> langues uniques à 3 lettres qui auparavant étaient "réunies" sous un
> même code à 2 lettres ISO 639-1 ou -2 pour une "macrolangue", voire
> parfois toute une famille (désormais dans ISO 639-5; l'autre exception
> étant les codes d'écritures ISO 15924 à 4 lettres dont la forme
> canonique n'a que la première lettre en initiale; tout le reste étant
> en minuscule, les sous-labels composés de 1 à 8 lettres ou chiffres
> étant séparés "canoniquement" par un "-").
>
> je ne vois pas quel usage peut avoir "fr-PF" en Polynésie française
> (cela ne peut pas désigner même les langues polynésiennes, ni des
> créoles à base de javanais ou d'autres langues austronésiennes, qui
> ont leur propre code ISO 639-3 à 3 lettres; les créoles de français ou
> d'anglais et de javanais ne sont pas des dialectes régionaux du
> français; il y a éventuellement un parler "caldoche" en
> Nouvelle-Calédonie, ayant conservé des formes régionales du français
> d'oil d'origine normande, mais le français standard s'est imposé
> depuis longtemps et les dialectes se sont perdus même avec les
> populations migrantes venues d'autres régions d'outre-mer ou ancienne
> colonies françaises d'Afrique et d'Asie du sud-est, ou migrants venus
> de ces pays devenus indépendants depuis : il n'y a pas de variété
> régionale réellement autochtone du français en Polynésie, les langues
> autochtones étant presque toutes austronésiennes ou d'une ancienne
> origine formosane, voire chinoise moderne bien plus récemment en même
> temps que les autres colonisations modernes).

Bonjour,

Je me permets de relancer ce sujet.

Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au
minimum. Cela résout la plupart des problèmes de caractères. Cela
remplace la plupart des ISO-machin qui sont obsolètes dans la plupart
des logiciels et étaient utiles il y a 30 ans quand il restaient des
équipements et logiciels informatiques bridés à 7 ou 8 bits/mots.

En quoi c'est un crime d'avoir un caractère exotique et pas
franco-français (c'est quoi d'ailleurs à part du nationalisme) dans un
nom, surtout un nom propre. Du temps des machines à écrire manuelles
avec leur AZERTY pourri, c'était compréhensible, mais en 2021, cela
signifie quoi ?

Cette discussion a déjà eu lieu ailleurs il y a 20 ans et a été résolu
en basculant les systèmes d'exploitation à l'UTF-8 (ou +).

Ce n'est parce que le courriel véhicule encore des ISO-machin, l'ASCII
et autres antiquités totalement inutiles pour des raisons historiques et
en partie à l'époque de nationalisme américain (qui s'affaiblit
d'ailleurs) qu'il faut continuer.

Même les IOT qui était encore un prétexte il y a 15 ans, se sont mis à
l'UTF-8, mais quelque chose m'échappe peut-être.

--
Rpnpif


_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Marc_marc
Bonjour,

Le 12.02.21 à 11:45, Rpnpif via Talk-fr a écrit :
> Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au minimum

je crois qu'il y a méprise sur le but de l'analyse.
le but n'est pas de dire que "tout l'UTF-8 au minimum" n'est pas accepté
le but me semble plutôt de dire "en france la majorité des noms
utilisent un alphabet français, si t'as un place=city avec name=Парижь
c'est à priori quelque chose à vérifier, le plus souvent une erreur
style maps.me du temps oü celui-ci ajoutait dans name le nom de la
langue de l'utilisateur au lieu de les mettre dans name:xx

personne n'a dit que c'était interdit d'avoir un resto chinois
à Paris qui dont le nom réel est en chinois (ce serra p'tre pas
facile pour les retrouver dans le moindre site avec un clavier
européen, mais ca c'est un autre soucis)

Cordialement,
Marc



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

France mailing list
Le 12/02/2021 à 12:19, Marc_marc a écrit :

> Bonjour,
>
> Le 12.02.21 à 11:45, Rpnpif via Talk-fr a écrit :
>> Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au minimum
> je crois qu'il y a méprise sur le but de l'analyse.
> le but n'est pas de dire que "tout l'UTF-8 au minimum" n'est pas accepté
> le but me semble plutôt de dire "en france la majorité des noms
> utilisent un alphabet français, si t'as un place=city avec name=Парижь
> c'est à priori quelque chose à vérifier, le plus souvent une erreur
> style maps.me du temps oü celui-ci ajoutait dans name le nom de la
> langue de l'utilisateur au lieu de les mettre dans name:xx
>
> personne n'a dit que c'était interdit d'avoir un resto chinois
> à Paris qui dont le nom réel est en chinois (ce serra p'tre pas
> facile pour les retrouver dans le moindre site avec un clavier
> européen, mais ca c'est un autre soucis)

Je comprends mieux, Marc. C'est parce que dans la discussion, les
problèmes des ISO-xxxx étaient abordés.

Quant au restaurant 我们在这里吃得很好, il ne s'adresse peut-être qu'à des
sinophones. Mais c'est vrai que sans alphabet latin, ce sera compliqué
avec l'administration. Sinon, il y a name=* et official_name=* ainsi que
operator=* qui sont utilisables pour les noms autres que l'enseigne.

Cordialement.

--
Rpnpif


_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Philippe Verdy
Pour les toponymes officiels il y a des exceptions même en France avec les
langues régionales (par exemple avec des accents et diacritiques inconnus
en français commun mais présents en corse ou en catalan, ou aussi dans les
langues d'outre-mer où les collectivités locales ont la faculté de les
utiliser pour leurs toponymie locale dont elles ont la charge ; le clavier
"standard" de base français, comme celui de Windows n'est plus recommandé.
il n'est même plus soutenu par l'AFNOR qui a défini un clavier français
bien plus étendu et qui réclame depuis longtemps sa normalisation dans
l'industrie... qui n'en a rien à faire, préférent inventer à la place des
touches multimédia ou Windows).

En attendant on ne peut que recommander en France de préférer acheter un
clavier français belge, ou français canadien (tant pis ici pour l'AZERTY).
Et il faudra aussi que l'adminsitration se fasse aussi à convertir ses
outils informatiques pour prendre en charge l'Unicode et pas tout réduire à
l'ASCII, sans même aucun accent souvent et souvent pire encore tout en
capitales (au mépris des préconisations de l'Académie française et des
typographes experts et parfaitement qualifiés de l'Imprimerie nationale ou
ceux de l'industrie française des imprimeurs et éditeurs de presse) !

Pour rappel, le français n'est obligatoire que pour la langue commune, pas
pour les noms propres intraduisibles (ou n'ayant pas d'usage réellement
attesté dans un dictionnaire français, qui est d'une autre langue que celle
du nom original sachant que tous ces dicos sont défectifs sur les noms
propres et ont des choix éditoriaux, de même que nombre de lexiques pour
des branches professionnelles particulières et qui se contredisent entre
eux même dans des domaines identiques ou qui se recouvrent fortement car
ils visent des publics différents et de toute façon n'imposent rien car ce
ne sont que des propositions destinées à faciliter le travail et les
échanges dans un groupe limité de réutilisateurs).

Il faut s'y faire : les noms propres (name=*) pour la plupart peuvent
échapper aux "règles" françaises, tant qu'on n'a pas un usage réellement
attesté (qui ne vaut pas pour les dénominations locales en dessous du
niveau de la commune, sachant aussi que ces noms de collectivités évoluent
aussi au cours du temps, l'usage va donc varier aussi masi des usages
"historiques" vont persister longtemps "sur le terrain".)

OSM veut cartographier le terrain, pas nécessairement ce qui est imposé
dans une norme ou une autre (locale ou non, et même pas nécessairement non
plus de France car on a maintenant aussi des normes européennes et des
normes internationales avec une publication officielle en français).

Donc ne pas imposer les ***prétendues*** "règles" françaises dans "name=*"
pour les noms propres d'objets situés en France, admettre qu'on a aussi
"alt_name=*",  "alt_name:fr=*", "official_name=*", "official_name:fr=*". Il
y a de la diversité sur le terrain, même s'il y a une "préférence" (basée
uniquement sur une statistique évolutive) dans le cas du "name=*" par
défaut, il faut savoir utiliser et prendre en compte cette diversité.


Le sam. 13 févr. 2021 à 11:18, Rpnpif via Talk-fr <[hidden email]>
a écrit :

> Le 12/02/2021 à 12:19, Marc_marc a écrit :
> > Bonjour,
> >
> > Le 12.02.21 à 11:45, Rpnpif via Talk-fr a écrit :
> >> Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au
> minimum
> > je crois qu'il y a méprise sur le but de l'analyse.
> > le but n'est pas de dire que "tout l'UTF-8 au minimum" n'est pas accepté
> > le but me semble plutôt de dire "en france la majorité des noms
> > utilisent un alphabet français, si t'as un place=city avec name=Парижь
> > c'est à priori quelque chose à vérifier, le plus souvent une erreur
> > style maps.me du temps oü celui-ci ajoutait dans name le nom de la
> > langue de l'utilisateur au lieu de les mettre dans name:xx
> >
> > personne n'a dit que c'était interdit d'avoir un resto chinois
> > à Paris qui dont le nom réel est en chinois (ce serra p'tre pas
> > facile pour les retrouver dans le moindre site avec un clavier
> > européen, mais ca c'est un autre soucis)
>
> Je comprends mieux, Marc. C'est parce que dans la discussion, les
> problèmes des ISO-xxxx étaient abordés.
>
> Quant au restaurant 我们在这里吃得很好, il ne s'adresse peut-être qu'à des
> sinophones. Mais c'est vrai que sans alphabet latin, ce sera compliqué
> avec l'administration. Sinon, il y a name=* et official_name=* ainsi que
> operator=* qui sont utilisables pour les noms autres que l'enseigne.
>
> Cordialement.
>
> --
> Rpnpif
>
>
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr
>
_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Yann-Vari Gwiader
J'ajoute que même Géoportail affiche des noms de lieux comportant des n
tildes en Bretagne.
C'est le cas de "Traoñ an dour" dans la commune de Bégard (22), par exemple
: https://ibb.co/HPcryf4 (capture d'écran).
Sur la base https://adresse.data.gouv.fr/base-adresse-nationale, ces tildes
n'apparaissent pas. Il faut croire qu'ils ont été filtrés d'une manière ou
d'une autre.

Le mar. 16 févr. 2021 à 17:21, Philippe Verdy <[hidden email]> a écrit :

> Pour les toponymes officiels il y a des exceptions même en France avec les
> langues régionales (par exemple avec des accents et diacritiques inconnus
> en français commun mais présents en corse ou en catalan, ou aussi dans les
> langues d'outre-mer où les collectivités locales ont la faculté de les
> utiliser pour leurs toponymie locale dont elles ont la charge ; le clavier
> "standard" de base français, comme celui de Windows n'est plus recommandé.
> il n'est même plus soutenu par l'AFNOR qui a défini un clavier français
> bien plus étendu et qui réclame depuis longtemps sa normalisation dans
> l'industrie... qui n'en a rien à faire, préférent inventer à la place des
> touches multimédia ou Windows).
>
> En attendant on ne peut que recommander en France de préférer acheter un
> clavier français belge, ou français canadien (tant pis ici pour l'AZERTY).
> Et il faudra aussi que l'adminsitration se fasse aussi à convertir ses
> outils informatiques pour prendre en charge l'Unicode et pas tout réduire à
> l'ASCII, sans même aucun accent souvent et souvent pire encore tout en
> capitales (au mépris des préconisations de l'Académie française et des
> typographes experts et parfaitement qualifiés de l'Imprimerie nationale ou
> ceux de l'industrie française des imprimeurs et éditeurs de presse) !
>
> Pour rappel, le français n'est obligatoire que pour la langue commune, pas
> pour les noms propres intraduisibles (ou n'ayant pas d'usage réellement
> attesté dans un dictionnaire français, qui est d'une autre langue que celle
> du nom original sachant que tous ces dicos sont défectifs sur les noms
> propres et ont des choix éditoriaux, de même que nombre de lexiques pour
> des branches professionnelles particulières et qui se contredisent entre
> eux même dans des domaines identiques ou qui se recouvrent fortement car
> ils visent des publics différents et de toute façon n'imposent rien car ce
> ne sont que des propositions destinées à faciliter le travail et les
> échanges dans un groupe limité de réutilisateurs).
>
> Il faut s'y faire : les noms propres (name=*) pour la plupart peuvent
> échapper aux "règles" françaises, tant qu'on n'a pas un usage réellement
> attesté (qui ne vaut pas pour les dénominations locales en dessous du
> niveau de la commune, sachant aussi que ces noms de collectivités évoluent
> aussi au cours du temps, l'usage va donc varier aussi masi des usages
> "historiques" vont persister longtemps "sur le terrain".)
>
> OSM veut cartographier le terrain, pas nécessairement ce qui est imposé
> dans une norme ou une autre (locale ou non, et même pas nécessairement non
> plus de France car on a maintenant aussi des normes européennes et des
> normes internationales avec une publication officielle en français).
>
> Donc ne pas imposer les ***prétendues*** "règles" françaises dans "name=*"
> pour les noms propres d'objets situés en France, admettre qu'on a aussi
> "alt_name=*",  "alt_name:fr=*", "official_name=*", "official_name:fr=*". Il
> y a de la diversité sur le terrain, même s'il y a une "préférence" (basée
> uniquement sur une statistique évolutive) dans le cas du "name=*" par
> défaut, il faut savoir utiliser et prendre en compte cette diversité.
>
>
> Le sam. 13 févr. 2021 à 11:18, Rpnpif via Talk-fr <
> [hidden email]>
> a écrit :
>
> > Le 12/02/2021 à 12:19, Marc_marc a écrit :
> > > Bonjour,
> > >
> > > Le 12.02.21 à 11:45, Rpnpif via Talk-fr a écrit :
> > >> Je ne comprends pas pourquoi il n'est pas accepté tout l'UTF-8 au
> > minimum
> > > je crois qu'il y a méprise sur le but de l'analyse.
> > > le but n'est pas de dire que "tout l'UTF-8 au minimum" n'est pas
> accepté
> > > le but me semble plutôt de dire "en france la majorité des noms
> > > utilisent un alphabet français, si t'as un place=city avec name=Парижь
> > > c'est à priori quelque chose à vérifier, le plus souvent une erreur
> > > style maps.me du temps oü celui-ci ajoutait dans name le nom de la
> > > langue de l'utilisateur au lieu de les mettre dans name:xx
> > >
> > > personne n'a dit que c'était interdit d'avoir un resto chinois
> > > à Paris qui dont le nom réel est en chinois (ce serra p'tre pas
> > > facile pour les retrouver dans le moindre site avec un clavier
> > > européen, mais ca c'est un autre soucis)
> >
> > Je comprends mieux, Marc. C'est parce que dans la discussion, les
> > problèmes des ISO-xxxx étaient abordés.
> >
> > Quant au restaurant 我们在这里吃得很好, il ne s'adresse peut-être qu'à des
> > sinophones. Mais c'est vrai que sans alphabet latin, ce sera compliqué
> > avec l'administration. Sinon, il y a name=* et official_name=* ainsi que
> > operator=* qui sont utilisables pour les noms autres que l'enseigne.
> >
> > Cordialement.
> >
> > --
> > Rpnpif
> >
> >
> > _______________________________________________
> > Talk-fr mailing list
> > [hidden email]
> > https://lists.openstreetmap.org/listinfo/talk-fr
> >
> _______________________________________________
> Talk-fr mailing list
> [hidden email]
> https://lists.openstreetmap.org/listinfo/talk-fr
>
_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Marc_marc
Le 17.02.21 à 17:28, Yann-Vari Gwiader a écrit :
> Sur la base https://adresse.data.gouv.fr/base-adresse-nationale, ces tildes
> n'apparaissent pas. Il faut croire qu'ils ont été filtrés d'une manière ou
> d'une autre.

c'est connu qu'un part importante de l'opendata
n'a aucun accent et même parfois aucune différence
capitale/majuscule/minuscule
signale leur si tu veux mais Noël est passé :)



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr
Reply | Threaded
Open this post in threaded view
|

Re: **Newsletter** Re: Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Chantal ARRUTI
Bonjour,

par exemple : Mariñeldeko bidea à Ayherre, le ñ apparait bien. https://adresse.data.gouv.fr/base-adresse-nationale/64086_4686_00040#19/43.39225/-1.25425 
Si l'adresse provient d'une BAL qui contenait le ñ, il est conservé, mais si l'adresse provient d'une autre source de données IGN, la Poste ..., la transformation est effectuée par ces organismes.

Chantal



De: "Marc_marc" <[hidden email]>
À: "Discussions sur OSM en français" <[hidden email]>
Envoyé: Mercredi 17 Février 2021 17:43:44
Objet: **Newsletter** Re: [OSM-talk-fr] Prise en compte de caractères non présents dans l'alphabet français pour les tags 'name'

Le 17.02.21 à 17:28, Yann-Vari Gwiader a écrit :
> Sur la base https://adresse.data.gouv.fr/base-adresse-nationale, ces tildes
> n'apparaissent pas. Il faut croire qu'ils ont été filtrés d'une manière ou
> d'une autre.

c'est connu qu'un part importante de l'opendata
n'a aucun accent et même parfois aucune différence
capitale/majuscule/minuscule
signale leur si tu veux mais Noël est passé :)



_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr 
_______________________________________________
Talk-fr mailing list
[hidden email]
https://lists.openstreetmap.org/listinfo/talk-fr