.TH KONWERT 1 "30 Jul 1998" "Konwert" "Podręcznik użytkownika Linuxa"
.SH NAZWA
konwert \- interfejs do różnych konwersji kodowań znaków
.SH UŻYCIE
.B konwert
.I FILTR
.RI [ PLIK ].\|.\|.\|
.RB [ \-o
.I WYNIK
|
.BR \-O ]
.SH OPIS
Konwert pozwala filtrować wiele plików przez wiele filtrów. Filtruje
podane
.IR PLIKI ,
albo stdin jeśli żadnych nie określono.
.PP
Prosty
.I FILTR
jest nazwą pliku wykonywalnego z katalogu
.I ~/.konwert/filters
albo z ogólnosystemowego, normalnie
.IR /usr/share/konwert/filters .
Taki program sam filtruje stdin na stdout.
.PP
Reguła filtrowania może być bradziej skomplikowana:
.PP
.B konwert
.IB FILTR1 + FILTR2
znaczy
.B konwert
.I FILTR1
|
.B konwert
.IR FILTR2 .
.PP
.B konwert
.IB FORMAT1 \- FORMAT2\fR,
o ile taki filtr nie istnieje, próbuje znaleźć wspólny
.IR FORMAT3 ,
taki że oba filtry
.IB FORMAT1 \- FORMAT3
i
.IB FORMAT3 \- FORMAT1
istnieją.
.PP
.B konwert
.IB FILTR / ARG /\fR.\|.\|.\|
przekazuje filtrowi argumenty. Argumenty mogą być też podane tutaj:
.IB FORMAT1 / ARG \- FORMAT2\fR.
Znaczenie arguentów zależy od konkretnego filtru.
.PP
.B konwert
.BI '( "KOMENDA ARG\fR.\|.\|.\|" )'
wykonuje dane polecenie powłoki. Jest to przydatne z opcjami
.B \-o
albo
.BR \-O .
Komenda nie może zawierać łańcucha
.BR )+ ,
który zakończy specyfikację tego filtru.
.SS OPCJE
.TP 10
\fB\-o\fP \fIWYNIK\fP
wyjście idzie do tego pliku/katalogu zamiast na stdout
.TP
.B \-O
każdy plik źródłowy jest zastępowany swoim tłumaczeniem
.TP
.B \-\-help
wyświetla opis i wychodzi
.TP
.B \-\-version
wyświetla informację o wersji i wychodzi
.PP
Przekierowanie wyjścia do jednego z plików źródłowych przez
.B \-o
albo
.B >
zamiast
.B \-O
zniszczy ten plik! Opcja
.B \-O
tworzy tymczasowy plik w
.I /tmp
i później kopiuje go z powrotem na źródło.
.SH KONWERSJE KODOWAŃ ZNAKÓW
Można konwertować tekst między dowolnymi dwoma zestawami znaków, na
przykład
.B konwert
.BR cp437\-iso2 .
.PP
Znaki niedostępne w docelowym zestawie będą zastąpione przybliżeniami
dostępnymi znakami. Przybliżenia nie muszą być pojedynczymi znakami.
.PP
Filtry obsługują teraz następujące zestawy znaków:
.TP
.B ascii
siedmiobitowe ASCII
.TP 16
.B utf8\fR = \fPunicode
Unikod (Unicode) w UTF-8
.TP 7
.PD 0
.B iso1\fR = \fPisolatin1
ISO-8859-1 albo ISO Latin 1 (zachodnioeuropejskie)
.TP
.B iso2\fR = \fPisolatin2
ISO-8859-2 albo ISO Latin 2 (środkowoeuropejskie)
.TP
.B iso3\fR = \fPisolatin3
ISO-8859-3 albo ISO Latin 3 (Esperanto)
.TP
.B iso4\fR = \fPisolatin4
ISO-8859-4 albo ISO Latin 4 (bałtyckie)
.TP
.B iso5\fR = \fPisolatincyr
ISO-8859-5 (cyrylica)
.TP
.B iso6\fR = \fPisolatinarabic
ISO-8859-6 (arabskie)
.TP
.B iso7\fR = \fPisolatingreek
ISO-8859-7 (greckie)
.TP
.B iso8\fR = \fPisolatinhebrew
ISO-8859-8 (hebrajskie)
.TP
.B iso9\fR = \fPisolatin5\fR = \fPisolatintur
ISO-8859-9 albo ISO Latin 5 (tureckie)
.TP
.B iso10\fR = \fPisolatin6\fR = \fPisolatinnordic
ISO-8859-10 albo ISO Latin 6 (nordyckie)
.TP
.B iso12\fR = \fPisolatin7\fR = \fPisolatinceltic
ISO-8859-12 albo ISO Latin 6 (celtyckie) - Draft
.TP
.B iso13\fR = \fPisolatin8\fR = \fPisolatinbaltic
ISO-8859-13 albo ISO Latin 6 (bałtyckie) - Draft
.TP
.B iso14\fR = \fPisolatin9\fR = \fPisolatinsami
ISO-8859-14 albo ISO Latin 6 (Sámi) - Draft
.TP
.B iso15
ISO-8859-15 - Draft
.PD
.TP 9
.PD 0
.B koi8r
KOI8-R (rosyjskie)
.TP
.B koi8u
KOI8-U (ukraińskie, białoruskie)
.TP
.B koi8uni
KOI8-Uni (cyrylica)
.PD
.TP 30
.PD 0
.B cp1250\fR = \fPwince\fR = \fPwinlatin2
Windows CP-1250 albo Win Latin 2 (środkowoeuropejskie)
.TP
.B cp1251\fR = \fPwincyr
Windows CP-1251 (cyrylica)
.TP
.B cp1252\fR = \fPwinwest\fR = \fPwinlatin1
Windows CP-1252 albo Win Latin 1 (zachodnioeuropejskie)
.TP
.B cp1253\fR = \fPwingr
Windows CP-1253 (greckie)
.TP
.B cp1254\fR = \fPwintur
Windows CP-1254 (tureckie)
.TP
.B cp1255\fR = \fPwinhebrew
Windows CP-1255 (hebrajskie)
.TP
.B cp1256\fR = \fPwinarabic
Windows CP-1256 (arabskie)
.TP
.B cp1257\fR = \fPwinbaltic
Windows CP-1257 (bałtytckie)
.TP
.B cp1258\fR = \fPwinviet
Windows CP-1258 (wietnamskie)
.PD
.TP 29
.PD 0
.B cp437\fR = \fPicmeng
DOS CP-437 (angielskie)
.TP
.B cp737\fR = \fPdosgreek
DOS CP-737 (greckie)
.TP
.B cp775\fR = \fPdosbaltic
DOS CP-775 (bałtyckie)
.TP
.B cp850\fR = \fPdoswest\fR = \fPdoslatin1
DOS CP-850 aka DOS Latin 1 (zachodnioeuropejskie)
.TP
.B cp852\fR = \fPdosce\fR = \fPdoslatin2
DOS CP-852 aka DOS Latin 2 (środkowoeuropejskie)
.TP
.B cp855\fR = \fPdoscyr
DOS CP-855 (cyrylica)
.TP
.B cp857\fR = \fPdostur
DOS CP-857 (tureckie)
.TP
.B cp860\fR = \fPdosportugal
DOS CP-860 (portugalskie)
.TP
.B cp861\fR = \fPdosiceland
DOS CP-861 (islandzkie)
.TP
.B cp862\fR = \fPdoshebrew
DOS CP-862 (hebrajskie)
.TP
.B cp863\fR = \fPdoscanadfr
DOS CP-863 (kanadyjskie - francuskie)
.TP
.B cp864\fR = \fPdosarabic
DOS CP-864 (arabskie)
.TP
.B cp865\fR = \fPdosnordic
DOS CP-865 (nordyckie)
.TP
.B cp866\fR = \fPdosrussian
DOS CP-866 (rosyjskie)
.TP
.B cp869\fR = \fPdosgreek2
DOS CP-869 (greckie 2)
.TP
.B cp874\fR = \fPdosthai
DOS CP-874 (tajskie)
.PD
.TP 12
.PD 0
.B mac
Macintosh Roman (zachodnioeuropejskie)
.TP
.B macce
Macintosh Central European (wschodnioeuropejskie)
.TP
.B maccyr
Macintosh Cyrillic (cyrylica)
.TP
.B macgreek
Macintosh Greek (greckie)
.TP
.B maciceland
Macintosh Icelandic (islandzkie)
.TP
.B mactur
Macintosh Turkish (tureckie)
.PD
.TP 13
.PD 0
.BR csk ,
.TP
.BR cyfromat ,
.TP
.BR dhn ,
.TP
.BR fidomazovia ,
.TP
.BR iea ,
.TP
.BR logic ,
.TP
.BR mazovia ,
.TP
.B microvex
DOSowe zestawy znaków do polskiego
.PD
.TP
.PD 0
.BR amigapl ,
.TP
.BR fat ,
.TP 9
.B xjp
Amigowe zestawy znaków do polskiego
.PD
.TP 11
.B kamenicky
DOSowy zestaw znaków do czeskiego i sĽowackiego
.TP 10
.B wingreek
WinGreek (kodowanie dla starożytnej greki według windowsowego fontu)
.TP 9
.PD 0
.B babelpl
TeX [polish]{babel}:
.I \&"a"c"e"l"n"o"s"z"r
.TP
.B ciachy
TeX \\prefixing:
.I /a/c/e/l/n/o/s/x/z
.PD
.TP 15
.PD 0
.B xmetodo
Esperanto:
.I cx gx hx jx sx ux
.RI ( vx\ w )
.TP
.B hmetodo
Esperanto:
.I ch gh hh jh sh u
.TP
.B antauxcxap
Esperanto:
.I ^c ^g ^h ^j ^s ^u
.RI ( ~u )
.TP
.B postcxap
Esperanto:
.I c^ g^ h^ j^ s^ u^
.RI ( u~ )
.TP
.B apostrofoj
Esperanto:
.I c' g' h' j' s' u'
.TP
.B malapostrofoj
Esperanto:
.I c` g` h` j` s` u`
.PD
.TP
.PD 0
.TP 8
.B viscii
VISCII (wietnamski)
.TP
.B viqri
Vietnamese Quoted Readable Implicit
.PD
.TP 9
.PD 0
.B htmldec
SGMLowe/HTMLowe numery znaków (dziesiątkowo):
.I &#198; &#283; &#8594;
.TP
.B htmlhex
SGMLowe/HTMLowe numery znaków (szesnastkowo)
.I &#xC6; &#x11B; &#x2192;
.TP
.B htmlent
SGMLowe/HTMLowe encje (nazwy znaków):
.I &AElig; &ecaron &rarr;
.TP
.B html
Wszystkie trzy powyżej (tylko jako format wejściowy)
.PD
.TP 7
.B tex
TeX wraz z niektórymi rozszerzeniami LaTeXa albo AMS-TeXa. Nie ma
rozróżnienia między normalnym trybem a matematycznym - prawdopodobbie
będziesz musiał ręcznie podostawiać trochę znaków
.IR $ .
.TP 11
.PD 0
.B mnemonic
Mnemoniki RFC 1345 poprzedzone przez
.I &
.TP
.B mnemonic1
Mnemoniki RFC 1345 poprzedzone przez
.I `
.PD
.TP 7
\fBany/\fIJĘZYK\fR (np. \fBany/pl-iso2\fP)
Ten specjalny format wejściowy rozpozna kodowanie automatycznie, na
podstawie częstości znaków znalezionych w tekście. Z każdym językiem
jest skojarzony zbiór możliwych kodowań używanych dla niego i średnie
częstości jego liter (wyłączając litery ASCII). Użyte zostanie najlepiej
pasujące kodowanie. Filtr obsługuje teraz języki
.B cs
(czeski),
.B de
(niemiecki),
.B el
(grecki),
.B eo
(Esperanto),
.B es
(hiszpański),
.B fr
(francuski),
.B he
(hebrajski),
.B it
(włoski),
.B pl
(polski),
.B pt
(portugalski),
.B ru
(rosyjski) i
.B sv
(szwedzki).
.PD
.TP 7
.B varpl
Wymieszane polskie ISO-8859-2, CP-1250 i UTF-8. W polskich warunkach
sugeruję podpięcie tego jako filtr w czytniku newsów (dla szybkości
lepiej wołać bezpośrednio, a nie przez konwerta).
.TP
.B vareo
Wymieszane różne kodowania Esperanta.
.SH OPCJE KONTROLUJĄCE POWYŻSZE KONWERSJE
.TP
\fB/1\fP (np. \fBkonwert iso2-ascii/1\fP)
Każdy niedostępny znak będzie zastąpiony przez pojedynczy przybliżający
znak, a nie przez napis. Przydatne dla programu filterm albo dla
preformatowanego tekstu. Ta opcja jest automatycznie włączana jeśli
filtr jest używany jako wyjście filterma.
.TP
.B /html
Zakłada, że tekst jest HTMLem. Znaki
.I \&" & < >
wynikłe z przybliżeń innych znaków będą prawidłowo wyeskejpowane do
.I &quot; &amp; &lt;
.IR &gt; .
Nagłówek
.I <META http-equiv="content-type" content="text/html; charset=.\|.\|.\|">
będzie poprawiony jeśli wystąpi.
.TP
.B /htmldec
Konwertuje META jak wyżej. Niedostępne znaki będą zakodowane
w &#Unikodzie;.
.TP
.B /htmlhex
Konwertuje META jak wyżej. Niedostępne znaki będą zakodowane
w szesnastkowym &#xUnikodzie;.
.TP
.B /tex
Niedostępne znaki będą opisane w TeXu. Znaki
.I # $ % & \\\\ ^ _ { | } ~
wynikłe z przybliżeń niektórych znaków będą prawidłowo wyeskejpowane do
.I \\\\# \\\\$ \\\\% \\\\& $\\\\backslash$ \\\\^{} \\\\_ \\\\{ $|$ \\\\}
.IR \\\\\\\\~{} .
.TP
.B /asciichar
Rozpoznaje niektóre reprezentacje znaków w ASCII, np.\|
.I (c) .\|.\|.\| 1/2
.IR >= .
.TP
.B /rosyjski
Rosyjski tekst będzie oddany w polskiej transkrypcji fonetycznej.
.PP
Niektóre filtry wyjściowe mogą użyć informacji o języku do lepszego
przybliżenia niedostępnych liter, np. w
.B /de
(niemieckim):
.I \(:a
\(->
.I ae
zamiast
.IR a .
.SH INNE FILTRY
.TP
.B any/\fIJĘZYK\fP-test
Rozpoznaje kodowanie, ale zamiast konwersji tekstu pokazuje tylko nazwę
kodowania. Dodatkowa opcja
.B /all
pokazuje wszystkie możliwe kodowania, posortowane od lepszych do
gorszych.
.TP
.PD 0
.B cr
.TP
.B lf
.TP
.B crlf
.PD
Wymusza określoną konwencję oznaczenia końców linii.
.B
cr
= Macintosh,
.B lf
= Unix i Amiga,
.B crlf
= Windows i DOS.
Konwencja wejściowa jest rozpoznawana automatycznie.
.TP
.B expand
Rozwija tabulacje na spacje (używa programu expand z textutils).
.TP
.B unexpand
Kompresuje spacje na początku linii do tabulacji (używa programu
unexpand z textutils).
.TP
.B rmspacesateol
Usuwa spacje i tabulacje z końców linii.
.TP
.PD 0
.B qp-8bit
.TP
.B 8bit-qp
.PD
Kodowanie MIME Quoted Printable:
.IR =A3=F3d=BC .
.TP
.PD 0
.B rtf-8bit
.TP
.B 8bit-rtf
.PD
Rich Text Format:
.IR \\\\\\\\'a3\\\\\\\\'f3d\\\\\\\\'9f .
.TP
.B txt-htmlchar
Eskejpuje
.I \&" & < >
w SGMLowe/HTMLowe encje
.I &quot; &amp; &lt;
.IR &gt; .
Wygodne do włączania pliku tekstowego w HTMLowych tagach <PRE> </PRE>.
.TP
.B htmlchar-txt
W drugą stronę.
.TP
.B rot13
Gb wrfg qrzbafgenpwn ebg13.
.TP
.PD 0
.B toupper
.TP
.B tolower
.PD
Zamienia tekst na duże / małe litery. Na razie tylko ASCII.
.TP
.B prn7pl
Konwertuje polskie znaki na sekwencje sterujęce drukarki zgodnej
z EPSON wykorzystując jedynie podstawowe znaki 7-bitowe, cofając głowicę
drukarki i drukując na odpowiedniej wysokości ,.'` dające w sumie pseudo-
polskie znaki. Przyjmuje opcje:
.B /nlq
(domyślne) optymalizowane do drukarek
o lepszej rozdzielczości i
.B /draft
- np. dla trybu draft 9-igłówki.
.SH PLIKI
.TP
.PD 0
.I /usr/share/konwert/filters/*
.TP
.I ~/.konwert/filters/*
.PD
.SH "ZOBACZ TEŻ"
.BR trs (1),
.BR filterm (1)
.SH BŁĘDY
Znak APPLE i zestawach mac* oraz znaki CH i ch w koi8cs nie są
zachowywane przy konwersji nawet kiedy są dostępne. Również nie
przestrzegają opcji /1. Powód: nie ma ich w Unikodzie.
.SH COPYRIGHT
Konwert jest pakietem służącym do konwersji między różnymi kodowaniami
znaków.
.PP
Copyright (c) 1998 Marcin 'Qrczak' Kowalczyk
.PP
Niniejszy program jest oprogramowaniem wolnodostępnym; możesz go
rozprowadzać dalej i/lub modyfikować na warunkach Powszechnej Licencji
Publicznej GNU, wydanej przez Fundację Wolnodostępnego Oprogramowania
- według wersji 2-giej tej Licencji lub którejś z późniejszych wersji.
.PP
Niniejszy program rozpowszechniany jest z nadzieją, iż będzie on
użyteczny - jednak BEZ JAKIEJKOLWIEK GWARANCJI, nawet domyślnej
gwarancji PRZYDATNOŚCI HANDLOWEJ albo PRZYDATNOŚCI DO OKREŚLONYCH
ZASTOSOWAŃ. W celu uzyskania bliższych informacji - Powszechna
Licencja Publiczna GNU.
.PP
Z pewnością wraz z niniejszym programem otrzymałeś też egzemplarz
Powszechnej Licencji Publicznej GNU; jeśli nie - napisz do Free
Software Foundation, Inc., 59 Temple Place, Suite 330, Boston,
MA  02111-1307  USA
.SH AUTOR
.ft CW
.nf
 __("<   Marcin Kowalczyk * qrczak@knm.org.pl http://qrczak.home.ml.org/
 \\__/       GCS/M d- s+:-- a21 C+++>+++$ UL++>++++$ P+++ L++>++++$ E->++
  ^^                W++ N+++ o? K? w(---) O? M- V? PS-- PE++ Y? PGP->+ t
QRCZAK                  5? X- R tv-- b+>++ DI D- G+ e>++++ h! r--%>++ y-
.fi
.ft R
