Skip to main content

Re: Concatenating items in the array

Concatenating items in the array 글에 대한 trackback입니다. 댓글에 <...> 괄호를 사용하니 이상해져서요. -_-;

C++을 주로 사용하는 개발자로써 언어에 대한 변명(?)을 해볼까 합니다.

C나 C++은 위의 join과 같은 작업은 언어 차원에서 지원하지 않습니다. 왜냐하면 orthogonal하지 않기 때문이죠. 쉽게 다음과 같이 얘기할 수 있을 것 같습니다.

"도대체 int array와 string이 무슨 관계가 있지?"

즉, C++이 생각하기에는 int array를 string으로 만드는 것은 int array가 할 일이 아닌거죠. 따라서 이러한 작업은 사용자가 직접 해주어야 합니다. (물론 여기서 사용자란 라이브러리 제작자들도 포함되겠죠?)

제가 C++로 작성해 본 join 함수는 아래입니다. iterator에 대해 decrement operator를 사용하기 위해 bidirectional iterator를 사용합니다.
#include <iostream>
#include <sstream>
#include <vector>
#include <boost/lambda/lambda.hpp>

template <class BidirectionalIterator>
std::string join(BidirectionalIterator first, BidirectionalIterator last,
const std::string& sep = " ")
{
  using namespace boost::lambda;

  std::stringstream ss;
  std::for_each(first, --last, ss << _1 << sep);
  ss << *last;
  return ss.str();
}

int main()
{
  int items[] = { 1, 2, 3, 4, 5 };
  const size_t size = sizeof(items) / sizeof(items[0]);

  std::cout << "[" << join(items, items + size, ", ") << "]n";
}

// output
// [1, 2, 3, 4, 5]
이런 언어들간의 철학 차이는 제가 C/C++을 RISC(Reduced Instruction Set Computer)처럼, ruby와 같은 요새 유행하는 스크립트 언어를 CISC(Complex instruction set computer)처럼 느끼는 이유이기도 합니다. 복잡한 기능을 기본적인 문법으로 조립을 하느냐 문법에서 직접 제공하느냐의 차이라는 거죠. 개인적으로는 RISC의 철학을 좋아하는데 요새 너무 스크립트 언어가 유행이라 조금씩 공부하고 있답니다. 그중 문법은 ruby가 가장 재밌는 것 같아요. 하지만 python의 줄 맞추기(?) 문법도 무시할 수 없죠. :-)


같은 날 저녁 추가

험... 제가 바보같이 foward iterator만으로도 가능한 함수를 bidirectional iterator 이상만 가능하도록 만들었네요. 아래 코드가 수정된 버전의 join 함수입니다.
template <class ForwardIterator>
std::string join(ForwardIterator first, ForwardIterator last,
const std::string& sep = " ")
{
  using namespace boost::lambda;

  std::stringstream ss;
  ss << *first;
  std::for_each(++first, last, ss << constant(sep) << _1);
  return ss.str();
}

Comments

  1. 정말 C++ 잘하시는 분이군요!!
    대단합니다.
    종종 놀러오겠습니다 ^^

    ReplyDelete
  2. 안녕하세요?

    저는 C++보다는 루비와 더 친합니다만 이원구님의 글을 재밌게 읽었습니다.
    RISC vs. CISC 의 비유는 아주 적절하다고 느낍니다.
    Orthogonality에 관한 말씀도 수긍이 갑니다.

    프로그램의 복잡성을 제어하기 위해 Orthogonality는 아주 필수적인 것이지만,
    컴퓨터의 성능이 발전하면서 점점 언어가 컴퓨터보다는 인간이 이해하기 쉽게끔 발전하는 것 같습니다.
    그래서 Orthogonality보다는 harmony의 비중이 점점 더 높아지구요.

    종종 놀러와서 C++에 대해 배우도록 하겠습니다.

    ReplyDelete
  3. 네 맞습니다. 점점 프로그래밍 언어가 인간이 작성하기 쉽고 알아보기 쉽게 발전하고 있죠.

    사실 요샌 하도 template metaprogramming이 발전하여 C++로도 작성하기 쉽고 알아보기 쉬운 문법들이 가능해지고 있습니다. 물론 언어 차원에서 제공하는건 아니지만 많은 라이브러리들이 존재하고 또 필요하면 직접 제작할 수도 있고요. boost::spirit 같은 DSL(Domain-Specific Language)을 보면 이게 C++인가 싶기도 하죠. :-)

    그리고 저 개인적으로는 ruby와 같은 스크립트 언어의 사용 편리함은 문법에서도 어느 정도 나오겠지만 인터프리터라는 특성에서 더 많이 나오는 것 같습니다. 코드를 만들때 조금 어려운 것은 사실 문제가 되지 않지만 조금씩 수정할 때 이 인터프리터라는 특성이 큰 장점이 됩니다. 게다가 우리가 대부분의 시간을 코드를 만드는데 쓰지 않고 수정하는데 쓰기 때문에 이 장점은 무시할 수 없게 되죠.

    위와 같은 생각에 java는 갈수록 인기가 떨어지지 않을까 생각했었는데 eclipse라는 괴물같은 툴이 나오면서 java의 수명을 연장시켜준 것 같습니다. 사실 java는 C++과 python, ruby등의 중간쯤에서 애매한 위치를 차지하고 있지 않나 싶거든요.

    물론 java 언어를 폄하하는 것은 아닙니다. 저도 BlogReader를 java 공부삼아 만들어보았는데 확실히 생산성이 높아짐을 알 수 있더군요. 물론 이 생산성이 java에서 나온것인지 eclipse에서 나온것인지는 좀 의심스럽습니다만... ;-)

    ReplyDelete
  4. 생산성은 eclipse에서 나왔다고 봅니다. :)
    근데.. lambda 안쓰고 std::ostream_iterator와 std::copy만으로도 가능하다는 생각이 문득 스쳐지나가네요 ;)

    ReplyDelete
  5. 네. 사실 std 라이브러리만 사용해야 한다면 copy와 ostream_iterator를 써야겠죠. 지금이야 많이들 써서 눈에 익었지만 처음 봤을땐 꽤나 당황스러운 문법이었습니다. ;-)

    그에 비하면 lambda 라이브러리를 사용한 코드는 비교적(?) 쉽게 이해 되는 코드죠. 그리고 copy와 ostream_iterator 조합보다는 for_each에 cout이 좀더 하려는 작업의 의미에 가까운 것 같기도 하고요. :-)

    ReplyDelete

Post a Comment

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

Coverity Prevent - 소스 코드 검사 도구

이번에 회사에서 소스 코드 검사 도구를 하나 구입하는데 이것저것 비교해본 결과 Coverity Prevent 라는 툴이 가장 좋아 이걸로 결정했다고 하더군요. 간단히 말하자면 Lint 처럼 소스 코드에 대해 static analysis를 하는 도구입니다. 그래서 시험삼아 돌려본 결과를 보게 되었는데 그 품질이 정말 놀랍군요. 메모리 릭이나 초기화하지 않은 변수, 버퍼 오버런, null 체크등등 거의 정확하게 에러를 보고해 줍니다. 다음은 전체 코드에서 발견된 문제점들을 리스트 형태로 보여주는 화면입니다. 정말 많군요. ;-) 다음은 이중 하나의 에러를 자세히 보기 위해 선택하여 들어간 화면입니다. 소스 코드에 라인번호와 에러가 발생한 위치, 에러가 발생할 수 있는 조건들을 자세히 보여줍니다. 정말 '와우!'입니다. 각 함수와 같은 이름들을 클릭하면 그 함수로 바로 이동할 수 있습니다. 사용해보니 개인적으로는 purify 같은 runtime 검사 도구보다 더 맘에 드는군요. 사실 Lint 계열의 도구들은 한번도 사용해본 적이 없는데 다른 것들도 한번 구해다 써봐야겠습니다. 이 툴의 유일한 문제는 비싸다는 것이랍니다. :-)