Hogyan lehet azonosítani, és módosítsa a fájl kódolása
Linux rendszergazdák, akik a web hosting, hogy mennyire fontos az, hogy tárolja a dokumentumokat a megfelelő html kódolás.
Ebben a cikkben megtudhatja, hogyan kell meghatározni a fájl kódolását a parancssorból a Linux.
Is, akkor megismerhetjük a legjobb megoldás átalakítására közötti szöveget különböző kódolások.
Ezen kívül, azt példákat nyújt az átalakítás szöveg között a leggyakoribb kódolásokat mint CP1251 (Windows-1251 Cirill), UTF-8. ISO-8859-1, és ASCII.
Határozzuk meg a fájl kódolását
Használja a következő parancsot, hogy megtudja, melyik használt karakterkódolás a fájlban:
Nem írja ki a fájl nevét (rövid üzemmód)
Annak megállapításához, a fájltípus és kódolási
Adjuk meg a kódolási in.txt fájlokat:
Változtassa meg a fájl kódolása
Használja a következő parancsot, hogy módosítsa a fájl kódolása:
Változás a kódolási
Változás, hogy a kódolás
Az eredményt elmentheti egy fájlba
Változás a fájl kódolását a CP1251 (Windows-1251 Cirill) UTF-8:
Változtassa meg a fájl kódolása ISO-8859-1 UTF-8, és mentse az eredményt out.txt:
Változás a kódolás a fájl ASCII UTF-8:
Változtassa meg a fájl kódolását UTF-8-ASCII:
Illegális bemeneti sorozat a helyzet: Mivel UTF-8 karaktereket tartalmazhat, amelyek nem alakulnak át ASCII, az iconv generál hibaüzenetet «illegális bemeneti sorozat a helyzetben«, amíg meg nem mondják, ne hagyja ki a nem konvertibilis ASCII karaktereket, a -c opciót.
Ahhoz, hogy kizárják a kimeneti érvénytelen karaktereket
Akkor elveszíti karaktereket: Megjegyzés: a iconv a -c opció bizonyos karakterek elvesznek.
Meglehetősen gyakori helyzet azok számára, akik együttműködnek a Windows és a Linux.
Különösen vonatkozik ez a Windows gépek cirill betűs.
Te másolni a fájlt Windowsról Linuxra, de amikor megnyitja a Linux, akkor lásd: „Êàêèå-Oi êðàêîçÿáðû” - Mi a ....
Ne essen kétségbe - ilyen vonalak könnyen átalakítható CP1251 kódolás (Windows-1251 cirill betűket) UTF-8:
Listája összes karakterkészlet
Sorold fel az összes ismert kódolás:
Én futás Linux Mint 18.1 fahéjjal 3.2. Volt néhány cseh karakterek nevét (például: Pešek.m4a). S megjelent, mint egy. és a fájl nevét tartalmazza figyelmeztetést kódolása érvénytelen. Régebben convmv konvertálni a fájlneveket (ISO-8859-1), hogy utf-8, de az S most úgy tűnik, mint egy másik karakter (egy négyzet 009A benne. Próbáltam a fájl parancs ajánlott, és a választ kapta, hogy a charset volt bináris. Hogyan lehet megoldani ezt? azt szeretném, hogy a fájlneveket tartalmazza a helyes utf-8 karakter.
Köszönjük a help-
OpenSSL: Ellenőrizze a megfelelő kulcsot az SSL tanúsítványt és a CSR