Hogyan lehet azonosítani, és módosítsa a fájl kódolása

Linux rendszergazdák, akik a web hosting, hogy mennyire fontos az, hogy tárolja a dokumentumokat a megfelelő html kódolás.

Ebben a cikkben megtudhatja, hogyan kell meghatározni a fájl kódolását a parancssorból a Linux.

Is, akkor megismerhetjük a legjobb megoldás átalakítására közötti szöveget különböző kódolások.

Ezen kívül, azt példákat nyújt az átalakítás szöveg között a leggyakoribb kódolásokat mint CP1251 (Windows-1251 Cirill), UTF-8. ISO-8859-1, és ASCII.

Határozzuk meg a fájl kódolását

Használja a következő parancsot, hogy megtudja, melyik használt karakterkódolás a fájlban:

Nem írja ki a fájl nevét (rövid üzemmód)

Annak megállapításához, a fájltípus és kódolási

Adjuk meg a kódolási in.txt fájlokat:

Változtassa meg a fájl kódolása

Használja a következő parancsot, hogy módosítsa a fájl kódolása:

Változás a kódolási

Változás, hogy a kódolás

Az eredményt elmentheti egy fájlba

Változás a fájl kódolását a CP1251 (Windows-1251 Cirill) UTF-8:

Változtassa meg a fájl kódolása ISO-8859-1 UTF-8, és mentse az eredményt out.txt:

Változás a kódolás a fájl ASCII UTF-8:

Változtassa meg a fájl kódolását UTF-8-ASCII:

Illegális bemeneti sorozat a helyzet: Mivel UTF-8 karaktereket tartalmazhat, amelyek nem alakulnak át ASCII, az iconv generál hibaüzenetet «illegális bemeneti sorozat a helyzetben«, amíg meg nem mondják, ne hagyja ki a nem konvertibilis ASCII karaktereket, a -c opciót.

Ahhoz, hogy kizárják a kimeneti érvénytelen karaktereket

Akkor elveszíti karaktereket: Megjegyzés: a iconv a -c opció bizonyos karakterek elvesznek.

Meglehetősen gyakori helyzet azok számára, akik együttműködnek a Windows és a Linux.

Különösen vonatkozik ez a Windows gépek cirill betűs.

Te másolni a fájlt Windowsról Linuxra, de amikor megnyitja a Linux, akkor lásd: „Êàêèå-Oi êðàêîçÿáðû” - Mi a ....

Ne essen kétségbe - ilyen vonalak könnyen átalakítható CP1251 kódolás (Windows-1251 cirill betűket) UTF-8:

Listája összes karakterkészlet

Sorold fel az összes ismert kódolás:

Én futás Linux Mint 18.1 fahéjjal 3.2. Volt néhány cseh karakterek nevét (például: Pešek.m4a). S megjelent, mint egy. és a fájl nevét tartalmazza figyelmeztetést kódolása érvénytelen. Régebben convmv konvertálni a fájlneveket (ISO-8859-1), hogy utf-8, de az S most úgy tűnik, mint egy másik karakter (egy négyzet 009A benne. Próbáltam a fájl parancs ajánlott, és a választ kapta, hogy a charset volt bináris. Hogyan lehet megoldani ezt? azt szeretném, hogy a fájlneveket tartalmazza a helyes utf-8 karakter.
Köszönjük a help-

OpenSSL: Ellenőrizze a megfelelő kulcsot az SSL tanúsítványt és a CSR