Idiomas

Idiomas o Lenguas (en el Tesauro)

Nota: este es un tesauro multilingüe; es decir, un tesauro que utiliza más de una lengua, en el que cada concepto está representado por un término preferido en cada una de las lenguas, y existe una única estructura de relaciones jerárquicas y asociativas entre los conceptos que es independiente de la lengua.

Los literales planos de RDF se definen formalmente como cadenas de caracteres con etiquetas de idioma opcionales. De este modo, SKOS permite una forma sencilla de etiquetado multilingüe. Esto se hace utilizando la etiqueta de idioma de una etiqueta léxica para restringir su alcance a un idioma concreto. El siguiente ejemplo ilustra cómo un concepto recibe una etiqueta preferente en inglés y otra en francés:

ex:animals rdf:type skos:Concepto;
skos:prefLabel “animales”@es;
skos:prefLabel “animaux”@fr.

Siguiendo la práctica común en el diseño de KOS, la etiqueta preferida de un concepto también puede ser utilizada para representar inequívocamente este concepto dentro de un KOS y sus aplicaciones. Por lo tanto, aunque el modelo de datos SKOS no lo impone formalmente, se recomienda que no haya dos conceptos en el mismo KOS que reciban la misma etiqueta léxica preferida para cualquier etiqueta lingüística.

Nótese que la noción de etiqueta preferida implica que un recurso sólo puede tener una etiqueta de este tipo por cada etiqueta de idioma, como se ve a continuación:

Etiquetado y etiquetas de idiomas

Se define las etiquetas de idiomas (véase más abajo) para identificar los idiomas. Obsérvese que “en”, “en-GB”, “en-US” son tres etiquetas de idioma diferentes, utilizadas con el inglés, el inglés británico y el inglés estadounidense, respectivamente. Del mismo modo, “ja”, “ja-Hani”, “ja-Hira”, “ja-Kana” y “ja-Latn” son cinco etiquetas lingüísticas diferentes que se utilizan con el japonés, el japonés escrito con kanji, la escritura hiragana, la escritura katakana o con caracteres latinos (rōmaji), respectivamente.

El gráfico siguiente es coherente con el modelo de datos SKOS, porque “en”, “en-US” y “en-GB” son etiquetas lingüísticas diferentes.

Ejemplo:

Color> skos:prefLabel “color”@es , “color”@es-US , “color”@es-GB .

En el siguiente gráfico, no hay conflicto entre las propiedades de etiquetado léxico, de nuevo porque “en” y “en-GB” son etiquetas de idioma diferentes, y por lo tanto el gráfico es consistente con el modelo de datos SKOS.

Ejemplo:
Amor> skos:prefLabel “amor”@es ; skos:altLabel “amor”@es-GB .

Tenga en cuenta, sin embargo, que estos ejemplos sólo sirven para ilustrar las características generales del modelo de datos SKOS, y no indican necesariamente las mejores prácticas para la provisión de etiquetas con diferentes etiquetas de idioma. Las convenciones de uso específicas de la aplicación y el idioma con respecto a las etiquetas y las etiquetas de idioma están fuera del alcance de la Referencia SKOS.

Se sugiere que las aplicaciones hagan coincidir las solicitudes de etiquetas en un idioma determinado con las etiquetas de idiomas relacionados que son proporcionadas por un esquema de conceptos SKOS, por ejemplo, mediante la implementación del algoritmo de “búsqueda”. Las aplicaciones que realizan la correspondencia de esta manera no requieren que las etiquetas se proporcionen en todas las variaciones lingüísticas posibles (de las cuales podría haber muchas), y son compatibles con los esquemas de conceptos SKOS que proporcionan sólo aquellas etiquetas cuyas formas léxicas son distintas para un idioma o colección de idiomas dados.

Etiquetado de Lenguajes o Idiomas

Los seres humanos de nuestro planeta han utilizado, en el pasado y en el presente, una serie de lenguas. Hay muchas razones por las que uno querría identificar la lengua utilizada al presentar o solicitar información.

A menudo es necesario identificar la lengua de un elemento de información o las preferencias lingüísticas de un usuario para poder aplicar el tratamiento adecuado. Por ejemplo, las preferencias lingüísticas del usuario en un navegador web pueden utilizarse para seleccionar las páginas web adecuadamente. La información sobre el idioma también puede utilizarse para seleccionar entre herramientas (como diccionarios) para ayudar a procesar o comprender contenidos en diferentes idiomas. El conocimiento de la lengua concreta utilizada por algún contenido informativo puede ser útil o incluso necesario para algunos tipos de procesamiento, por ejemplo, la corrección ortográfica, el habla sintetizada por ordenador, la transcripción en Braille o las representaciones impresas de alta calidad.

Una forma de indicar el idioma utilizado es etiquetar el contenido de la información con un identificador o “etiqueta”. Estas etiquetas también pueden utilizarse para especificar las preferencias del usuario a la hora de seleccionar el contenido de la información o para etiquetar atributos adicionales del contenido y los recursos asociados.

A veces, las etiquetas de idioma se utilizan para indicar atributos lingüísticos adicionales del contenido. Por ejemplo, indicar información específica sobre el dialecto, el sistema de escritura o la ortografía utilizados en un documento o recurso puede permitir al usuario obtener la información en una forma que pueda entender, o puede ser importante para procesar o representar el contenido dado en una forma o estilo adecuados.

La etiqueta lingüística

Las etiquetas de idioma se utilizan para ayudar a identificar las lenguas, ya sean habladas, escritas, de signos o de otro tipo, con el fin de comunicarse. Esto incluye las lenguas construidas y artificiales, pero excluye las lenguas no destinadas principalmente a la comunicación humana, como los lenguajes de programación.

Sintaxis

Una etiqueta lingüística o de idioma se compone de una secuencia de una o más “subetiquetas”, cada una de las cuales afina o reduce el rango de lenguas identificadas por la etiqueta general.

Existen diferentes tipos de subetiquetas, cada una de las cuales se distingue por su longitud, su posición en la etiqueta y su contenido: cada tipo de subetiqueta puede reconocerse únicamente por estas características. Esto permite extraer y asignar cierta información semántica a las subetiquetas, aunque no se reconozcan los valores específicos de las mismas. Por lo tanto, un procesador de etiquetas lingüísticas no necesita tener una lista de etiquetas o subetiquetas válidas (es decir, una copia de alguna versión del Registro de Subetiquetas Lingüísticas de IANA) para realizar las operaciones comunes de búsqueda y correspondencia. Las únicas excepciones a esta capacidad de inferir el significado a partir de la estructura de las subetiquetas son las etiquetas antiguas enumeradas en las producciones “regular” e “irregular”.

Subetiquetas lingüísticas ampliadas

Las subetiquetas de lengua extendida se utilizan para identificar ciertas lenguas especialmente seleccionadas que, por diversas razones históricas y de compatibilidad, se identifican estrechamente con una subetiqueta de lengua primaria existente o se etiquetan con ella. Las subetiquetas de lengua extendida se utilizan siempre con la subetiqueta de lengua primaria que las acompaña (indicada con un campo
Prefijo” en el registro) cuando se utilizan para formar la etiqueta de lengua.

Todos los idiomas que tienen una subetiqueta de idioma extendida en el registro también tienen un registro de subetiqueta de idioma primario idéntico en el registro. Esta subetiqueta de idioma principal es RECOMENDADA para formar la etiqueta de idioma.

Revisor de hechos: Chris


Posted

in

,

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *