Skip to main content

C++ of the Day #18 - Returning local variable

이번 글도 역시 뉴스그룹에서 가져왔습니다. ((c.l.c.m:Returning local variable
그런데 이 질문을 올린 Minkoo Seo라는 이름을 보니 얼마전 댓글을 달아주신 서민구님이네요. :-)))

Question

#include <iostream>
using namespace std;

const char *foo()
{
  string f = "fo";
  f += "o";
  return f.c_str();
}

int main()
{
  cout << foo() << endl; // I need const char * here!!!
  return EXIT_SUCCESS;
} 
질문은.
  1. 위의 코드와 같이 local 변수를 const char*로 리턴하면 괜찮다고 하던데 정말인가요? (어디서 char*로 리턴하는건 안되지만 const char*로 리턴하는건 된다는 내용을 읽은 것 같아요.)
  2. 만약 안 괜찮다면 foo()함수는 어떻게 만들어야 할까요?


Answer

사실 이 질문들에 대한 답은 간단합니다.
  1. 괜찮지 않습니다. local 변수인 string 객체는 이미 파괴되었기 때문에 cout 에서 그 포인터를 읽을 때는 이미 존재하지 않는 객체에 access하는 것이기 때문입니다.
  2. 간단히 리턴 타입을 string으로 바꿔주면 됩니다. 물론 리턴할때도 f.c_str() 대신에 그냥 f 를 리턴하면 되겠죠?
이 질문에서 재밌게 생각되는 점은 원래 질문 내용보다는 어디선가 이런 내용을 읽은 것 같다는 내용입니다. 사실 내용은 전혀 다르지만 비슷한 내용이 있지요. 바로 const reference에 대한 casting입니다. 아마 const reference 를 본것을 const pointer로 착각하신건 아닐까 하는 생각이 드네요. 간단히 설명하면 다음과 같습니다. 먼저 아래 코드를 보시죠.
class Widget;
Widget getWidget();
void useWidge(Widge& w);

Widget w = getWidget() + getWidget(); // 1)
const Widget& w1 = getWidget(); // 2)
useWidget(w1); // 3)
먼저 1)번 라인의 두개의 getWidet()에서 리턴된 temporary 객체들의 수명은 그 라인이 끝날때까지뿐입니다. 1)번 라인을 pseudo code로 설명해보면 다음과 같습니다.
Widget temp1 = getWidget();
Widget temp2 = getWidget();
Widget w = temp1 + temp2;
destroy temp2;
destroy temp1;
즉, 1)번 라인이 수행되고 나면 w에는 두개의 Widget을 더한 값이 정상적으로 들어있으나 각 getWidget()에서 리턴한 temporay 객체들은 모두 없어집니다. 그럼 2)번 라인은 어떨까요? 만약 1)번과 같은 규칙이 적용된다면 3)번 라인에서는 이미 없어진 temporary 객체에 대한 const reference로 함수를 호출하는 것이 되어 문제가 발생할것입니다. 하지만 이 경우에는 const reference가 이 temporary 객체의 수명을 w1 이름의 수명만큼으로 연장시켜줍니다. 따라서 이 temporary 객체의 수명은 라인의 끝을 벗어나 w1이 포함된 scope가 끝날때까지로 연장되며 따라서 3)번의 함수 호출은 정상적으로 이루어지게 됩니다. ((Cast to reference 이 관련 링크는 예전에 제가 만들었던 홈페이지입니다. 여기서 설명한 내용의 좀 더 자세한 내용을 보시려면 참고하세요. 그런데 인코딩이 utf-8이라 firefox에서 인코딩을 조정해주어야 보이더군요. 잊고 있다가 다시 보니 감회가 새롭군요. 그때에 비하면 지금은 블로깅 툴들이 있어서 글쓰기는 쉽네요. ;-))) 이러한 원리를 잘 사용하고 있는 것중의 하나가 바로 ScopeGuard 클래스죠.((원본 링크를 걸려고 했는데 원본 링크가 없어져 버렸네요. -_-;))

Comments

  1. 더 재밌는건.. const char*를 리턴하는 코드가 libstd++나 stlport기반에서는 동작 할거라는 생각이 문득...
    컨테이너들이 memory pooling을 하기 때문에 재수좋으면 작동 하지요..

    요런 버그때문에 삽질을 많이 한다는.. -_-;

    const char*로 리턴한다는 이야기는 아마도 c_str()의 리턴타입이 const char*이기 때문에 나온게 아닐까라는... ^_^

    ReplyDelete
  2. 사실 문제가 된 코드도 대부분의 single-thread환경에서는 문제가 없으리라 생각됩니다. 굳이 delete한 char 배열에 다른 값을 채워넣을만큼 한가한 CPU는 없을테니까요.
    하지만 이게 단순히 const char*가 아니고 클래스 포인터라던지 multi-thread환경이라던지 하면 문제가 되겠지요.

    저희도 가끔 문제가 발생해서 원인을 찾아보면 이런 문제가 있더라고요. 요샌 거의 다 찾았는지 잘 나진 않지만 multi-thread 환경에서도 CPU 로드가 적당할때는 안나다가 거의 노는 CPU가 없어질때쯤이면 다양한 문제들이 생기더군요. :-)

    ReplyDelete
  3. 네!!!!!! 바로 그겁니다... 제가 정말 기억이 잘 안나지만 아마도 cout 로 출력하는것과 연관이 있었던거 같아요..
    아 정말 감사;;

    2번 라인에 대해서 이해가 확실하지 않아서 질문하고싶은데요..
    2번의 경우에는 const를 썼기 때문에, return Widget()이 있다면 임시 객체가 생성되어서
    이것이 카피되는데 그 임시 객체가 바로 파괴가 안된다는 것이고, const는 생성된
    임시 객체를 잠시 보존해준다는 것이라구 이해했고요..

    c_str()을 반환할때는 이미 있는 객체를 반환하는 것이므로 그것이 파괴되는 것을
    막을 수 없는것.. 맞는지요?

    ReplyDelete
  4. 먼저 c_str()을 받는 경우 수명에 대해 생각해야 할 값은 const char* 그 자체입니다. 이 포인터 값을 변수에 저장하면 그 값의 수명은 변수의 수명만큼이 됩니다. 하지만 그 포인터가 가리키는 객체의 수명은 리턴받는 입장에서는 제어하기 불가능하며 이 경우 함수의 로컬에 선언된 auto 변수(스택 변수)이므로 함수가 끝나는 순간 파괴됩니다. 따라서 이후 그 저장하고 있는 포인터의 값을 사용하면 존재하지 않는 객체에 접근하는 것이 되어 문제가 발생합니다.
    하지만 위의 2번 라인의 경우 수명에 대해 생각해야 할 것은 임시 객체가 되며 const reference에 임시 객체를 할당하는 경우 그 수명이 연장됩니다. 그리고 const 만으로는 수명에 아무 영향을 미칠 수 없죠. :-)

    ReplyDelete

Post a Comment

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

std::map에 insert하기

얼마전 회사 동료가 refactoring한 코드를 열심히 revert하고 있어서 물어보니 다음과 같은 문제였습니다. 원래 코드와 refactoring한 코드는 다음과 같더군요. nvp[name] = value; // original code nvp.insert(make_pair(name, value)); // refactored 아시겠지만 위의 두 라인은 전혀 다른 기능을 하죠. C++03에 보면 각각 다음과 같이 설명되어 있습니다. 23.1.2/7 Associative containers a_uniq.insert(t): pair<iterator, bool> inserts t if and only if there is no element in the container with key equivalent to the key of t. The bool component of the returned pair indicates whether the insertion takes place and the iterator component of the pair points to the element with key equivalent to the key of t. 23.3.1.2/1 map element access [lib.map.access] T& operator[](const key_type& x); Returns: (*((insert(make_pair(x, T()))).first)).second. 원래 코드는 매번 새 값으로 이전 값을 overwrite했지만 새 코드는 이전에 키가 존재하면 새값으로 overwrite하지 않습니다. 따라서 원래 기능이 제대로 동작하지 않게 된것이죠. 그래서 물어봤죠. "왜 이렇게 했어?" "insert가 성능이 더 좋다 그래서 했지." :-? 사실 Fowler 아저씨는 Refactoring 책에서 refactoring은 성능을 optimizing하기 위한 것이 아니다라...