Skip to main content

C file's orientation 2.

이전글에서 했던 추측은 정답과는 거리가 멀었군요. c.l.c.m.에 올린 글의 답변을 보니 제가 stream의 state에 대한 생각을 전혀 안했었네요. -_-;

문제가 되었던 g++ 3.4.3, solaris 10-x86 환경에서는 현재 imbue되어 있는 locale로는 출력할 수 없는 character set을 만나면 state의 fail bit을 셋하게 되어 있었습니다. 이후 operation들은 현재 상태가 good()이 아니므로 모두 실패한 것이었습니다.

따라서 이전글에서 보았던 다음 코드들의 결과는 다음과 같이 다시 해석되어야 합니다.


wcout << L"aaaa" << endl;
wcout << L"한글bbbb" << endl;
wcout << L"cccc" << endl;
// result
aaaa



wcout << L"aaaa" << endl;
wcout << L"한글bbbb" << endl;
wcout << "cccc" << endl; // changed to byte-string literal

// result
aaaa



wcout << L"aaaa" << endl;
wcout << L"한글bbbb" << endl;
cout << "cccc" << endl; // changed to cout

// result
aaaa
cccc


"한글" 문자열 출력이 실패하면서 wcout의 state의 fail bit이 set됩니다. 따라서 이후 wcout에 대한 operation들은 모두 실패하게 됩니다. 하지만 마지막 경우의 cout은 wcout과는 전혀 다른 stream이므로 문자열이 정상적으로 출력되었던 것입니다.

결과 확인을 위해 다음 코드로 확인했습니다.


wcout << L"aaaa" << endl;
wcout << L"한글bbbb" << endl;
cout << "cccc" << endl; // changed to cout
cout << wcout.fail() << endl;
cout << cout.fail() << endl;
wcout.clear();
wcout << "cccc" << endl;

// result
aaaa
cccc
1
0
cccc


예상대로 clear()를 호출하여 state를 good() 상태로 만들어주면 다시 wcout으로도 정상적으로 출력됨을 확인할 수 있습니다. stream의 state와 cout, wcout의 관계를 생각하지 못해 전혀 엉뚱한 추측을 했었네요. 부끄럽습니다. *-_-*

추가로 "korean" locale을 imbue()해서 출력을 해보려고 했는데 지원을 안하더군요. -_-

그리고 이전 글에서 한글외의 모든 문자가 정상적으로 출력되었던 Redhat환경의 경우는 한글 출력을 할 수 없더라도 fail bit을 set하지 않아 한글외의 문자들이 정상적으로 출력되었던 것이었습니다.

Comments

  1. 다시 또 들리게 되었습니다. 저도 이 문제 때문에 골똘히 생각하다가, 검색을 했었는데, 의외로 손쉽게 찾을 수 있었네요. 정말 감사합니다. 그리고 사랑합니다! .. 물론 이 포스팅을요 ㅋㅋ

    ReplyDelete
  2. 유니코드로 갔음에도, 로케일 문제 때문에 제한을 받을 수 밖에 없는 건 아무리 생각해도 유니코드가 제 역활을 하지 못하지 않나 싶습니다.

    ReplyDelete
  3. 도움이 되셨다니 기쁘네요. 그나저나 이 블로그... 뭔가 해야 할텐데요. -_-;

    ReplyDelete

Post a Comment

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

std::map에 insert하기

얼마전 회사 동료가 refactoring한 코드를 열심히 revert하고 있어서 물어보니 다음과 같은 문제였습니다. 원래 코드와 refactoring한 코드는 다음과 같더군요. nvp[name] = value; // original code nvp.insert(make_pair(name, value)); // refactored 아시겠지만 위의 두 라인은 전혀 다른 기능을 하죠. C++03에 보면 각각 다음과 같이 설명되어 있습니다. 23.1.2/7 Associative containers a_uniq.insert(t): pair<iterator, bool> inserts t if and only if there is no element in the container with key equivalent to the key of t. The bool component of the returned pair indicates whether the insertion takes place and the iterator component of the pair points to the element with key equivalent to the key of t. 23.3.1.2/1 map element access [lib.map.access] T& operator[](const key_type& x); Returns: (*((insert(make_pair(x, T()))).first)).second. 원래 코드는 매번 새 값으로 이전 값을 overwrite했지만 새 코드는 이전에 키가 존재하면 새값으로 overwrite하지 않습니다. 따라서 원래 기능이 제대로 동작하지 않게 된것이죠. 그래서 물어봤죠. "왜 이렇게 했어?" "insert가 성능이 더 좋다 그래서 했지." :-? 사실 Fowler 아저씨는 Refactoring 책에서 refactoring은 성능을 optimizing하기 위한 것이 아니다라...