expertenaustausch > linux.debian.user.german

André Bischof (12.09.2005, 19:30)
Hallo zusammen,

ich stehe nach wie vor mit den locales auf Kriegsfuss.

- In manchen meiner Emails (postfix/cyrus21) werden Umlaute falsch
dargestellt, merkwürdigerweise nicht in allen. Teilweise nur im Betreff.
Scheint vor allem dann vorzukommen, wenn kein Mime-Typ/Charset im Header
gesetzt ist.
- Spamassassin über amavisd sagt:
Parsing of undecoded UTF-8 will give garbage when decoding entities at
/usr/share/perl5/Mail/SpamAssassin/HTML.pm line 182.
- joe läßt mich keine Umlaute schreiben, backticks gehen nicht (auch
beim Kopieren)

Meine Einstellungen:
root@linux:/etc/cron.dev# cat /etc/sysconfig/i18n
LANG="de_DE@euro"
COUNTRY="de"
LANGUAGE="de"
CHARSET="iso8859-15"
XMODIFIERS=""

Sollte ich auf UTF8 wechseln? Sind weitere Konfigurationsdateien
anzupassen?

Vielleicht hat ja jemand eine Beispielkonfiguration für mich?

Danke schonmal und viele Grüße
André
Ulrich Fürst (12.09.2005, 20:00)
"André Bischof" <frisco> wrote:
> Sollte ich auf UTF8 wechseln?

Also ich habe das mal gemacht (teils erhoffte ich mir Verbesserungen,
teils und v.a. aus Spieltrieb). Ich bin v.a. aus Faulheit noch nicht
zurückgewechselt. Die wenigsten Internet-Seiten sind in UTF-8. Soweit
nicht schlimm. Aber sehr viele haben kein Charset angegeben, sodass die
Seite dann etwas unschön aussieht, weil halt das defaultcharset utf-8
ist.
Ähnlich bei e-Mails.
Davon abgesehen können diverser Programme nicht mit UTF-8. Mir bekannt
z.B. sylpheed-(claws) und irgendein Scan-Programm* (sarge-versionen).
Wie viele das aber insgesamt sind, weiß ich nicht.

aktuell kann ich jetzt natürlich dem Programm das nicht mit utf-8 kann
eine andere lokale beim Start mitgeben. Wenn ich dann von diesem
Programm wieder auf die Festplatte speichere bekomme ich aber wieder
Probleme. Also alles (noch?) nicht so das gelbe vom Ei...

Ulrich

* Hab jetzt keine Lust das durchprobieren.
Claudius Hubig (12.09.2005, 21:50)
"Ulrich Fürst" <fuerst.ulrich> wrote:
>Also ich habe das mal gemacht (teils erhoffte ich mir Verbesserungen,
>teils und v.a. aus Spieltrieb). Ich bin v.a. aus Faulheit noch nicht
>zurückgewechselt. Die wenigsten Internet-Seiten sind in UTF-8. Soweit
>nicht schlimm. Aber sehr viele haben kein Charset angegeben, sodass die
>Seite dann etwas unschön aussieht, weil halt das defaultcharset utf-8
>ist.
>Ähnlich bei e-Mails.
>Davon abgesehen können diverser Programme nicht mit UTF-8. Mir bekannt
>z.B. sylpheed-(claws)


Ich habe hier mit Slypheed-Claws-gtk2 keine Probleme, gelegentlich muss
das Zeichenset manuell eingestellt werden, aber nicht wirklich wild.
Und zum Surfen benutze ich eh Opera, da sind versch. Zeichensätze
sowieso kein Problem (zumindest bei mir).

Mit freundlichen Grüßen

Claudius
André Bischof (12.09.2005, 23:20)
Claudius Hubig schrieb:
> "Ulrich Fürst" <fuerst.ulrich> wrote:
> Ich habe hier mit Slypheed-Claws-gtk2 keine Probleme, gelegentlich muss
> das Zeichenset manuell eingestellt werden, aber nicht wirklich wild.
> Und zum Surfen benutze ich eh Opera, da sind versch. Zeichensätze
> sowieso kein Problem (zumindest bei mir).


Hallo ihr beiden,

hm, das hilft mir jetzt nicht so wirklich weiter - im Thunderbird wär
das ja noch akzeptabel, da kann ich wechseln, aber die Meldung von
Spamassassin, der Garbage lernt und mangelnde Zeichen in joe finde ich
schon blöd.

Sind denn meine Einstellungen korrekt (s. erstes Posting)? Oder muss ich
vielleicht noch bestimmte Pakete zusätzlich installieren oder in anderen
Konfigurationsdateien Einstellungen machen?

Wenn ich noch Systemeinstellungen posten soll, sagt Bescheid.

Danke jedenfalls schonmal & viele Grüße
André
Andreas Pakulat (13.09.2005, 00:00)
On 12.09.05 19:06:11, André Bischof wrote:
> Meine Einstellungen:
> root@linux:/etc/cron.dev# cat /etc/sysconfig/i18n


Hmm, woher kommt denn diese Konfigurations-Datei? Die gibts hier gar
nicht. Die System-Locale wird i.A. in /etc/environment gesetzt mittles
der Zeile

LANG="..."

Das macht auch ein dpkg-reconfigure locales

Mehr war hier bisher nicht noetig (naja ich setze LANG per User in
$HOME/.bash_profile)

Andreas
André Bischof (13.09.2005, 00:30)
Andreas Pakulat schrieb:
> On 12.09.05 19:06:11, André Bischof wrote:
> Hmm, woher kommt denn diese Konfigurations-Datei? Die gibts hier gar
> nicht. Die System-Locale wird i.A. in /etc/environment gesetzt mittles
> der Zeile
> LANG="..."
> Das macht auch ein dpkg-reconfigure locales


hm, war mal vor langer Zeit als Basis 'ne
Knoppix-Festplatteninstallation, vielleicht sind das noch Reste. Wobei
ich gerade sehe, das /etc/bashrc die oben genannte ausliest, außerdem
/etc/profile.

in /etc/environment steht LANG=de_DE@euro, also ohne Anführungszeichen -
ist das korrekt?

> Mehr war hier bisher nicht noetig (naja ich setze LANG per User in
> $HOME/.bash_profile)


da hab ich nur ~/.bashrc, die wiederum /etc/profile ausliest.

Merkwürdig. Tipps?

Gute Nacht und bis morgen,
André
Michael Rex (13.09.2005, 01:00)
Quoth Ulrich Fürst:
> "André Bischof" <frisco> wrote:
>> Sollte ich auf UTF8 wechseln?

> Also ich habe das mal gemacht (teils erhoffte ich mir Verbesserungen,
> teils und v.a. aus Spieltrieb).


Ich habe das auch mal gemacht, vor allem wegen der Interoperabilität mit
anderen Systemen (Mac OS X, Linuxe, die da weiter sind als Debian,
Windows), und es bisher nicht bereut.

Die einzigen Programme, die ich benutze und die Probleme mit utf-8 haben
sind zsh und Licq. Das kann ich verschmerzen, vor allem, da KDE ansonsten
mit utf-8 perfekt zurecht kommt. Und die anderen hoffentlich endlich
lernen, sich der Zukunft anzupassen (ja, ich denke, daß an utf-8 kein Weg
vorbei führt)

> Ich bin v.a. aus Faulheit noch nicht
> zurückgewechselt. Die wenigsten Internet-Seiten sind in UTF-8. Soweit
> nicht schlimm. Aber sehr viele haben kein Charset angegeben, sodass die
> Seite dann etwas unschön aussieht, weil halt das defaultcharset utf-8
> ist.
> Ähnlich bei e-Mails.


Damit hatte ich bisher nun wirklich keine Probleme. Wie gesagt, ich setze
KDE ein, sicherlich hängt das also auch davon ab, wie gut der Window
Manager / die Desktop Environment utf-8 unterstützt.

> Davon abgesehen können diverser Programme nicht mit UTF-8. Mir bekannt
> z.B. sylpheed-(claws) und irgendein Scan-Programm* (sarge-versionen).
> Wie viele das aber insgesamt sind, weiß ich nicht.
> aktuell kann ich jetzt natürlich dem Programm das nicht mit utf-8 kann
> eine andere lokale beim Start mitgeben. Wenn ich dann von diesem
> Programm wieder auf die Festplatte speichere bekomme ich aber wieder
> Probleme. Also alles (noch?) nicht so das gelbe vom Ei...


Ja, leider. Linux behandelt utf-8 leider noch etwas stiefmütterlich. Solange
man sich nicht mit anderen Systemen austauschen muß ist sicherlich eine der
ISO-8859-Locales schmerzärmer als Unicode, aber wie gesagt, ich denke an
Unicode (oder irgendwelchen anderen Multibyte-Charsets, von denen ja
Unicode momentan das verbreitetste unter Linux ist) führt auf lange Sicht
kein Weg vorbei

Bye, Michael
Andreas Pakulat (13.09.2005, 01:10)
On 13.09.05 00:09:10, André Bischof wrote:
> Andreas Pakulat schrieb:
> hm, war mal vor langer Zeit als Basis 'ne Knoppix-Festplatteninstallation,


Autsch ;-)

> vielleicht sind das noch Reste. Wobei ich gerade sehe, das /etc/bashrc die oben


Die /etc/bashrc gibts in Debian nicht. Die hast du dir selbst angelegt,
oder das Knoppix hat das gemacht.

> genannte ausliest, außerdem /etc/profile.


Also /etc/profile setst PS1 und den Pfad, mehr nicht. Alles andere ist
von Knoppix uebrig. Wenn du den Muell loswerden willst: Neuinstallation
von bash mit vorherigem purge.

> in /etc/environment steht LANG=de_DE@euro, also ohne Anführungszeichen - ist
> das korrekt?


Jupp.

> >Mehr war hier bisher nicht noetig (naja ich setze LANG per User in
> >$HOME/.bash_profile)

> da hab ich nur ~/.bashrc, die wiederum /etc/profile ausliest.


Das ist auch krank. man bash, Abteilung INVOCATION lesen, da wird erklaert welche
Dateien wofuer gedacht sind. bashrc wird bei jeder interaktiven Shell
ausgefuehrt, *profile ist gedacht fuer login-shells.

Der Unterschied ist vor allem der, dass man in bashrc Dinge wie

export PATH=$PATH:$HOME/blah/blub

lieber lassen sollte, da das sonst mit einem Pfad wie

/usr/bin:$HOME/blah/blub:$HOME/blah/blub

enden kann.

/etc/profile wird bei login-shells sowieso eingelesen und sollte von der
..bashrc nicht eingelesen werden. Umgedreht macht man aber haeufig ein

.. /etc/bash.bashrc
bzw.
.. $HOME/.bashrc

Um auch in einer login-shell die *bashrc einzulesen.

Andreas
Andreas Pakulat (13.09.2005, 01:20)
On 13.09.05 00:39:42, Michael Rex wrote:
> Das kann ich verschmerzen, vor allem, da KDE ansonsten mit utf-8
> perfekt zurecht kommt.


Haha, der war gut. K3b kann/konnte keine CD's mit CD-TEXT erstellen,
wenn der CD-Künstler Umlaute enthaelt. k3b hat(te) die ID3-Informationen
aus mp3-Dateien nicht korrekt ausgelesen - wenn die ID3-Tags
UTF-8 kodiert sind (was durchaus normal ist in einer UTF-8 Umgebung).
Auch sonst gibts hier und da kleinere Problemchen, vor allem dann wenn
Programme annehmen eine Datei haette ein bestimmtes Encoding und das ist
dann doch nicht so...

Aber ich gebe zu: Die Situation in KDE3.3 und 3.4 ist deutlich besser
als in 2.2 oder 3.0. Nur von "perfekt" sind wir immernoch weit entfernt.

> Damit hatte ich bisher nun wirklich keine Probleme. Wie gesagt, ich setze
> KDE ein, sicherlich hängt das also auch davon ab, wie gut der Window
> Manager / die Desktop Environment utf-8 unterstützt.


Eher weniger, mehr ob die zugrundeliegende Widget-Bibliothek mit UTF-8
umgehen kann. GTK1 kann das nicht. Qt konnte das schon immer und
dennoch, sobald Programme diese Widget-Bibliotheken verlassen kann es zu
Problemen kommen. Mails in KMail koennen auch falsch angezeigt werden,
wenn der Sender reinschreibt die Mail ist us-ascii kodiert und dabei
enhaelt sie eigentlich latin1/latin9 - passiert Oje-Nutzern haeufig.
Oder wenn ein Client eine Mail als utf-8 deklariert obwohl sie nur
latin1 kodiert ist. Das Problem ist ja, dass man nicht aus dem
Byte-Strom ablesen kann welche Kodierung benutzt wurde und somit auf
solche Metadaten angewiesen ist - wenn die falsch sind, dann hat man
Pech.

Aehnlich ist das mit o.g. Beispiel fuer ID3-Tags, wenn im Tag kein
Encoding angegeben ist (was meiner Erfahrung nach _kein_ Tag-Editor
macht) dann nimmt k3b, kid3 usw. an es waere latin1 kodiert - selbst in
einer UTF-8 Umgebung. Das fuehrt dann zu Problemen. Einzig id3v2 macht
es "richtig" und gibt die Bytes unkodiert aus, sprich wenn die ID3-Tags
UTF-8 sind, kann ichs lesen, wenn sie latin1 kodiert sind fehlen die
Umlaute.

Solange Unicode (intern in den Programmiersprachen) und eine
Unicode-Kodierung (egal ob UTF-8, UTF-16, UTF-32 oder sonstwas) nicht
ueberall Standard sind, wirds immer irgendwo haken.

BTW: Hab grad keine Lust die UTF-16 und -32 Specs durchzusehen: Kann man
UTF-16 von UTF-8 und UTF-32 unterscheiden - nur anhand der Bytefolgen?

> Ja, leider. Linux behandelt utf-8 leider noch etwas stiefmütterlich.


Naja, Windows ist auch nicht viel besser - da gibts UCS2 nur intern,
extern wird latin1-?? koi oder sonstwas benutzt.

Andreas
Markus Schulz (13.09.2005, 01:20)
Am Dienstag, 13. September 2005 00:39 schrieb Michael Rex:
> Quoth Ulrich Fürst:
> Ich habe das auch mal gemacht, vor allem wegen der Interoperabilität
> mit anderen Systemen (Mac OS X, Linuxe, die da weiter sind als
> Debian, Windows), und es bisher nicht bereut.
> Die einzigen Programme, die ich benutze und die Probleme mit utf-8
> haben sind zsh und Licq. Das kann ich verschmerzen, vor allem, da KDE
> ansonsten mit utf-8 perfekt zurecht kommt. Und die anderen
> hoffentlich endlich lernen, sich der Zukunft anzupassen (ja, ich
> denke, daß an utf-8 kein Weg vorbei führt)


hmm, welches Problem hast du denn mit licq? Setze das auch mit UTF8 ein,
das einzige Problem was mir bekannt ist, das andere deine Umlaute dann
nicht verstehen, da deren Client das nicht kennt?!? Daher habe ich licq
wieder auf latin9 zurückgestellt (kann man zum Glück im Programm selbst
wählen).

Oder bin ich da jetzt auf dem Holzweg und licq hat doch das Problem?
Andre Bischof (13.09.2005, 09:30)
Andreas Pakulat schrieb:
(...)
>>hm, war mal vor langer Zeit als Basis 'ne Knoppix-Festplatteninstallation,

> Autsch ;-)


ja, ich weiß, steht auch schon lange aus - in naher Zukunft soll's auf
neue Hardware, dann starte ich direkt mit einer Neuinstallation und
ziehe den Rest über die Paketliste nach, dann Schritt für Schritt
Konfigurationen aus /etc, bis alles läuft - mir gefällt das so auch
nicht mehr.

(...)
> Also /etc/profile setst PS1 und den Pfad, mehr nicht. Alles andere ist


Playstation? Hab ich nicht. *lol* Was bedeutet PS1?

>>in /etc/environment steht LANG=de_DE@euro, also ohne Anführungszeichen - ist
>>das korrekt?

> Jupp.


ok und schade - denn das heißt meine Einstellungen sind korrekt, womit
ich wiederum nicht weiß wie ich mein Problem lösen soll - wenn ich alles
so lasse wie's ist wird Spamassassin weiterhin über UTF-8-Garbage
meckern und joe keine Umlaute darstellen.

Was muss ich tun, um das abzustellen?

Ratlose Grüße ;-)
André
Markus Meyer (13.09.2005, 09:50)
On [Tue, Sep 13 09:28], Andre Bischof wrote:

Hola Andre, (ohne é ?)

>Playstation? Hab ich nicht. *lol* Was bedeutet PS1?


PS1 ist der Prompt, den du in der Bash hast.
root@butterblume:~ $ echo $PS1
\u@\h:\w $

Es gibt auch noch PS2,3 und 4. Mehr findest du mit
man bash | less -p "PS1 "
und dort einmal "n" drücken, um zum zweiten Eintrag von PS1 zu gelangen.

Gruß,
Ulrich Fürst (13.09.2005, 10:00)
"André Bischof" <frisco> wrote:
> - Spamassassin über amavisd sagt:
> Parsing of undecoded UTF-8 will give garbage when decoding entities at
> /usr/share/perl5/Mail/SpamAssassin/HTML.pm line 182.


Sieht nach:
<http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=297899>
aus.

Ulrich
Frisco (13.09.2005, 10:20)
Hallo Markus,

Markus Meyer schrieb:
> On [Tue, Sep 13 09:28], Andre Bischof wrote:
> Hola Andre, (ohne é ?)


hm, bei dir klappt's - ich hab die Erfahrung gemacht, dass ein e mit
Accent oft falsch dargestellt wird - womit wir wieder bei meinem
Ausgangsproblem wären.

>> Playstation? Hab ich nicht. *lol* Was bedeutet PS1?

> PS1 ist der Prompt, den du in der Bash hast.
> root@butterblume:~ $ echo $PS1


Netter Rechnername! :-)

> \u@\h:\w $
> Es gibt auch noch PS2,3 und 4. Mehr findest du mit man bash | less
> -p "PS1 " und dort einmal "n" drücken, um zum zweiten Eintrag von PS1 zu
> gelangen.


Ah, sehr aufschlussreich, danke.

Viele Grüße
André
Markus Meyer (13.09.2005, 10:30)
On [Tue, Sep 13 09:58], Frisco wrote:

Hi André,

>hm, bei dir klappt's - ich hab die Erfahrung gemacht, dass ein e mit Accent
>oft falsch dargestellt wird - womit wir wieder bei meinem Ausgangsproblem
>wären.


Ich schreibe E-Mails in Vim auf einer US-Tastatur. Die Sonderzeichen
kriege ich über die "digraphs" in Vim hin.

Gruß,

Ähnliche Themen