gibberi.sh

פעמים רבות אני נתקל במקרים בהם אני צריך לגשת לקבצים "פגומים" שקודדו בצורה שגוייה, ולא ניתן לראות את תוכנם בצורה הרגילה. כאשר עושים העתקה והדבקה לטקסט בג'יבריש (במקרה שלנו – אותיות לטיניות, טקסט עברי), מערכת ההפעלה מתרגמת באופן מיידי את הטקסט ליוניקוד, מה שמקשה מאד על ההמרה שלו חזרה לעברית. מאחר שמערכות לינוקס עובדות בעיקר ביוניקוד (בניגוד למערכות ווינדוס ששומרות על "תאימות לאחור"), כדי שאפשר יהיה לקרוא את הטקסט צריך להמיר אותו חזרה ליוניקוד אחרי התיקון.

אני משתמש בתוכנת ה־iconv ככלי שמאפשר לעשות את המניפולציות הללו על קבצים. מדובר בכלי חזק ונוח, שיודע להמיר בין כל קידוד טקסט קיים וגם להודיע למשתמש כאשר יש תקלות אפשריות (בניגוד לשימוש ב־awk ו־sed, לדוגמה). מאחר ופעולת ההמרה אינה טריוויאלית, צריך להתחכם ולהמיר את הטקסט לאותיות לטיניות ומשם להחזיר אותו ליוניקוד בתור עברית. בצורה הבאה –
iconv -f utf-8 -t latin1
iconv -f windows-1255 -t utf-8

אני נוהג להשתמש בקיצור דרך שיחסוך ממני את ההקלדה של שתי השורות הללו. הכנסת השורה הבאה בקובץ ~/.profile תאפשר להפעיל את התסריט באמצעות הפקודה gibberish. מותר ורצוי להשתמש בהגדרות ניתוב קלט/פלט כדי לעשות משהו מועיל עם התסריט.

alias gibbrish="iconv -f utf-8 -t latin1 | iconv -f windows-1255 -t utf-8"

קידוד נעים!

השאר תגובה