Round Trip Safety Configuration de caracteres Shift-JIS

Shift-JIS es un sistema de codificación para caracteres japoneses. Es el equivalente a ASCII, un sistema de codificación para caracteres ingleses.

Codificación nativa y Unicode

Dado que Shift-JIS y ASCII definen los caracteres para un idioma, los podemos considerar como sistemas de codificación nativa. Unicode es un sistema de codificación de caracteres que define los caracteres para todos los idiomas. Debido a que el software se utiliza en un entorno multilingüe global, los caracteres que utilizan los sistemas para procesamiento deben convertirse a menudo entre sistemas de codificación nativa y Unicode.

Seguridad de recorrido de ida y vuelta

Los problemas asociados con las conversiones entre los sistemas de codificación nativa y Unicode se conocen como problemas de seguridad de recorrido de ida y vuelta.

Mediante Unicode, se desarrollan aplicaciones que pueden admitir la entrada simultánea de caracteres en distintos idiomas. Los datos de entrada, introducidos por los usuarios o recuperados de las bases de datos, pueden contener caracteres codificados en un sistema de codificación nativa. Por ejemplo, en el sistema operativo Microsoft Windows, los caracteres ingleses introducidos por un usuario se codifican mediante Windows-1252.

Cuando una aplicación recibe caracteres en un sistema de codificación nativa, los convierte a Unicode para procesarlos. Una vez que ha finalizado el procesamiento, los caracteres se pueden volver a convertir en el sistema de codificación nativa.

En la mayoría de los casos, los caracteres se convierten sin ambigüedad, ya que cada carácter nativo se correlaciona con un solo carácter Unicode. Si la conversión de un carácter de idioma nativo a y desde Unicode genera el carácter original, el carácter se considerará seguro para un recorrido de ida y vuelta.

Por ejemplo, el carácter "A" es seguro para un recorrido de ida y vuelta en Windows-1252, de la forma siguiente:

  • El carácter de Windows-1252 para "A" es 0x41.
  • Se convierte en el carácter correspondiente de Unicode U+0041.
  • Ningún otro carácter de Windows-1252 se convierte en el mismo carácter Unicode, por lo que siempre se vuelve a convertir en 0x41.

Problemas específicos de Shift-JIS

Si bien los caracteres de la mayoría de los sistemas de codificación de caracteres nativos son seguros para un recorrido de ida y vuelta, el sistema de codificación Shift-JIS supone una excepción. Aproximadamente 400 caracteres de Shift-JIS no son seguros para un recorrido de ida y vuelta, porque varios caracteres de este grupo se pueden correlacionar al mismo carácter Unicode. Por ejemplo, los dos caracteres Shift-JIS 0x8790 y 0x81e0 se convierten en el carácter Unicode U+2252.

IBM Cognos BI y Shift-JIS

IBM® Cognos Business Intelligence utiliza Unicode. La seguridad de recorrido de ida y vuelta de los caracteres es fundamental para garantizar la precisión de los datos en los informes generados.

El programa de utilidad Round Trip Safety Configuration garantiza la seguridad del recorrido de ida y vuelta de los caracteres Shift-JIS sólo cuando se utilizan ambos para convertir los caracteres:

  • De Shift-JIS en Unicode
  • De Unicode en Shift-JIS

Si los datos se solicitan a una base de datos con su propio mecanismo automático para realizar la conversión de Shift-JIS a Unicode, IBM Cognos BI no llamará al programa de utilidad Round Trip Safety Configuration para convertir los caracteres de Unicode a Shift-JIS. No se puede garantizar la seguridad de recorrido de ida y vuelta de los caracteres de los datos.

Para obtener más información sobre el programa de utilidad Round Trip Safety Configuration, consulte Programa de utilidad Round Trip Safety Configuration.