서버에서 현재 디렉토리안에 있는 수많은 파일들의 인코딩을 변경해야 할때 어떻게 해야 할까?
예) 현재디렉토리안의 .php파일들을 euc-kr에서 utf-8로 변경할떄
[code]for F in ./*.php ; do iconv -c -f utf-8 -t euc-kr $F > $F.tmp && mv $F.tmp $F ; done[/code]
위와같은 명령어 한줄을 입력해 주면 되겠다. -f에 파일의 형의, -t에 바꿀 인코딩형을 지정해 주면 된다.
Tag Archives: 인코딩
[자바스크립트] 인코딩/디코딩 유틸
JAVA와 Javascript간에 Ajax로 통신을 하다 보니 인코딩상에 문제가 발생하는것을 알게 되었다.
물론 encodeURIComponent 같은것을 이용했지만 특수문자등이 정확히 인코딩/디코딩 되지 않는 문제가 있었다.
다음의 유틸을 사용하니깐 잘 되었다.
[code]/*
문자열을 인코딩 할때 사용한다. 다음과 같이 디코딩 하여 사용한다.
JAVA : URLEncoder.decode(str, “UTF-8”)
JS : decodeURL(str)
*/
function encodeURL(str){
var s0, i, s, u;
s0 = “”; // encoded str
for (i = 0; i < str.length; i++){ // scan the source
s = str.charAt(i);
u = str.charCodeAt(i); // get unicode of the char
if (s == ” “){s0 += “+”;} // SP should be converted to “+”
else {
if ( u == 0x2a || u == 0x2d || u == 0x2e || u == 0x5f || ((u >= 0x30) && (u <= 0x39)) || ((u >= 0x41) && (u <= 0x5a)) || ((u >= 0x61) && (u <= 0x7a))){ // check for escape
s0 = s0 + s; // don’t escape
}
else { // escape
if ((u >= 0x0) && (u <= 0x7f)){ // single byte format
s = “0”+u.toString(16);
s0 += “%”+ s.substr(s.length-2);
}
else if (u > 0x1fffff){ // quaternary byte format (extended)
s0 += “%” + (0xf0 + ((u & 0x1c0000) >> 18)).toString(16);
s0 += “%” + (0x80 + ((u & 0x3f000) >> 12)).toString(16);
s0 += “%” + (0x80 + ((u & 0xfc0) >> 6)).toString(16);
s0 += “%” + (0x80 + (u & 0x3f)).toString(16);
}
else if (u > 0x7ff){ // triple byte format
s0 += “%” + (0xe0 + ((u & 0xf000) >> 12)).toString(16);
s0 += “%” + (0x80 + ((u & 0xfc0) >> 6)).toString(16);
s0 += “%” + (0x80 + (u & 0x3f)).toString(16);
}
else { // double byte format
s0 += “%” + (0xc0 + ((u & 0x7c0) >> 6)).toString(16);
s0 += “%” + (0x80 + (u & 0x3f)).toString(16);
}
}
}
}
return s0;
}
/*
문자열을 디코딩 할때 사용한다. 다음과 같이 인코딩 하여 사용한다.
JAVA : URLEncoder.encode(str, “UTF-8”)
JS : encodeURL(str)
*/
function decodeURL(str)
{
var s0, i, j, s, ss, u, n, f;
s0 = “”; // decoded str
for (i = 0; i < str.length; i++){ // scan the source str
s = str.charAt(i);
if (s == “+”){s0 += ” “;} // “+” should be changed to SP
else {
if (s != “%”){s0 += s;} // add an unescaped char
else{ // escape sequence decoding
u = 0; // unicode of the character
f = 1; // escape flag, zero means end of this sequence
while (true) {
ss = “”; // local str to parse as int
for (j = 0; j < 2; j++ ) { // get two maximum hex characters for parse
sss = str.charAt(++i);
if (((sss >= “0”) && (sss <= “9”)) || ((sss >= “a”) && (sss <= “f”)) || ((sss >= “A”) && (sss <= “F”))) {
ss += sss; // if hex, add the hex character
} else {–i; break;} // not a hex char., exit the loop
}
n = parseInt(ss, 16); // parse the hex str as byte
if (n <= 0x7f){u = n; f = 1;} // single byte format
if ((n >= 0xc0) && (n <= 0xdf)){u = n & 0x1f; f = 2;} // double byte format
if ((n >= 0xe0) && (n <= 0xef)){u = n & 0x0f; f = 3;} // triple byte format
if ((n >= 0xf0) && (n <= 0xf7)){u = n & 0x07; f = 4;} // quaternary byte format (extended)
if ((n >= 0x80) && (n <= 0xbf)){u = (u << 6) + (n & 0x3f); –f;} // not a first, shift and add 6 lower bits
if (f <= 1){break;} // end of the utf byte sequence
if (str.charAt(i + 1) == “%”){ i++ ;} // test for the next shift byte
else {break;} // abnormal, format error
}
s0 += String.fromCharCode(u); // add the escaped character
}
}
}
return s0;
}[/code]