Skip to main content

C++ of the Day #28 - random_number_iterator 구현

원래는 지난번 글로 Boost::Iterator 라이브러리 얘기를 마치려고 했는데 읽던 책에 random number generator에 관한 내용이 나오네요. ((The C++ Standard Library Extensions: A Tutorial and Reference, Pete Becker, Addison-Wesley Professional, 2006))

이 내용을 이용하여 random_number_iterator를 만들어 보았습니다. random number generator는 tr1에 있으나 같은 내용이 boost에도 있으므로 boost 라이브러리를 사용하였습니다.

먼저 random number generator는 여러가지 random number 생성을 해주는 engine들과 이들 engine을 결합하여 다른 엔진을 만들어 주는 compound engine, 그리고 이를 사용하는 각종 distribution 및 engine과 distribution을 결합해 주는 variate_generator등으로 구성되어 있습니다. 또한 기본 engine들에 적당한 default 값을 사용한 predefine된 타입도 제공합니다.
boost::mt19937 rng;
boost::uniform_int<> six(1,6);
boost::variate_generator<boost::mt19937&, boost::uniform_int<> > die(rng, six);

int x = die();
예를 들어 위의 코드에서 mt19937은 mersenne_twister라는 engine을 사용하여 predefined된 타입입니다. ((Boost Random Number Library 문서에서 가져왔습니다.)) 그리고 uniform_int는 어떤 random number의 sequence를 특정 범위안의 uniformly distributed random sequence로 변경해 주는 클래스이고 마지막으로 variate_generator는 engine과 distribution을 결합시키기 위해 사용되었습니다.

이렇게 해서 생성된 die 객체는 function call operator를 가지고 있어 마지막 라인과 같이 호출할 때마다 새로운 1~6의 범위안에서 uniformly distributed된 random number를 리턴합니다. 즉, 정육면체 주사위를 simulate할 수 있는 객체죠.

이 function call operator를 사용하여 특정 container의 값을 채우기 위한 방법에는 다음과 같은 것들이 있습니다.
for (int i = 0; i < vi.size(); ++i) vi[i] = die();

std::generate(vi.begin(), vi.end(), die);

std::generate_n(vi.begin(), vi.size(), die);
하지만 이번 글에서 만들어 볼 iterator 클래스를 사용하면 다음과 같이 사용이 가능합니다.
random_number_iterator<??> first(die, N);
random_number_iterator<??> last(die);
copy(first, last, vi.begin());
여기서 N은 이 iterator가 만들어 낼 random number의 갯수입니다. 그리고 ?? 부분에 대해서는 뒤에서 알아 보겠습니다.

그럼 Boost::Iterator에 대한 설명을 생략하고 바로 코드를 보겠습니다.
template <class Gen>
class random_number_iterator
  : public boost::iterator_facade<
      random_number_iterator<gen>,
      typename Gen::result_type const,
      forward_traversal_tag
    >
{
  typedef typename Gen::result_type result_type;
public:
  explicit random_number_iterator(Gen& gen, int cnt = 0)
      : gen_(gen), cnt_(cnt) {
    if (cnt != 0) val_ = gen_();
  }

private:
  friend class boost::iterator_core_access;

  void increment() { --cnt_; val_ = gen_(); }

  bool equal(random_number_iterator const& other) const
  {
    return cnt_ == other.cnt_;
  }

  result_type const& dereference() const { return val_; }

private:
  Gen& gen_;
  int cnt_;
  result_type val_;
};
cnt_ 멤버는 default로 0으로 셋팅되어 iterator의 end()를 나타내게 됩니다. 0이 아닌 값은 end()가 아니며 increment() 호출시마다 1씩 감소하여 결국 end()가 되도록 만들었습니다. 그리고 이 increment()시에 gen_()을 호출하여 random number를 val_에다 저장하도록 하였습니다.

여기서 만약 val_ 멤버 변수를 없애기 위해 dereference()마다 gen_()을 호출하였다면 아래와 같은 코드에서 i와 j는 서로 다른 값을 가지는 문제가 생기게 됩니다.
i = *iter;
j = *iter;
다음으로 주의할 점은 생성자에서 cnt_가 0이면 val_의 초기값을 셋팅하지 않는다는 것입니다. 물론 end()를 dereference하는 것은 금지되어 있어 사용자가 호출하진 않겠지만 만약 여기서 gen_()을 호출한다면 reference로 가지고 있는 gen_의 상태가 변하게 되고 역시 이 reference를 가지고 있을 다른 iterator의 상태에 영향을 주기 때문입니다.

그럼 이제 이 iterator를 사용하여 앞에서 살펴본 ?? 를 가지고 있던 코드를 다시 작성해 보겠습니다.
random_number_iterator<variate_generator<boost::mt19937&, boost::uniform_int<> > > first(die, N);
random_number_iterator<variate_generator<boost::mt19937&, boost::uniform_int<> > > last(die);
copy(first, last, vi.begin());
너무 길군요. :-| 그럼 이를 좀 간단히 해줄 helper function을 만들어 보겠습니다.
template <class Gen>
random_number_iterator<gen> make_random_number_iterator(Gen& gen, int cnt = 0)
{
return random_number_iterator<gen>(gen, cnt);
}
이제 이 function을 사용하여 다음과 같이 코드를 작성할 수 있습니다.
copy(
make_random_number_iterator(die, N),
make_random_number_iterator(die),
vi.begin());
이제 실제 타입이 아무리 길어도 위의 함수를 사용하여 비교적 간단히 algorithm들을 사용할 수 있게 되었습니다.

참고로 C++에 auto 키워드가 추가되고 나면 다음과 같이 작성할 수 있게 됩니다.
auto first = make_random_number_iterator(die, N),
auto last = make_random_number_iterator(die),
copy(first, last, vi.begin());
이번 글에서는 Boost::Iterator 시리즈의 복습 삼아 random_number_iterator를 작성해 보았습니다. 해보면서 느끼는 건데 iterator 만들기 정말 쉬워졌군요. :-)

Comments

Popular posts from this blog

1의 개수 세기 - 해답

벌써 어제 말한 내일이 되었는데 답을 주신 분이 아무도 없어서 좀 뻘쭘하네요. :-P 그리고 어제 문제에 O(1)이라고 적었는데 엄밀히 얘기하자면 O(log 10 n)이라고 적었어야 했네요. 죄송합니다. ... 문제를 잠시 생각해보면 1~n까지의 수들 중 1의 개수를 얻기 위해서는 해당 숫자 n의 각 자리의 1의 개수가 모두 몇개나 될지를 구해서 더하면 된다는 사실을 알 수 있습니다. 예를 들어 13이라는 수를 생각해 보면 1~13까지의 수에서 1의 자리에는 1이 모두 몇개나 되는지와 10의 자리에는 모두 몇개나 되는지를 구해 이 값을 더하면 됩니다. 먼저 1의 자리를 생각해 보면 1, 11의 두 개가 있으며 10의 자리의 경우, 10, 11, 12, 13의 네 개가 있습니다. 따라서 2+4=6이라는 값을 구할 수 있습니다. 이번엔 234라는 수에서 10의 자리를 예로 들어 살펴 보겠습니다. 1~234라는 수들 중 10의 자리에 1이 들어가는 수는 10, 11, ..., 19, 110, 111, ... 119, 210, 211, ..., 219들로 모두 30개가 있음을 알 수 있습니다. 이 규칙들을 보면 해당 자리수의 1의 개수를 구하는 공식을 만들 수 있습니다. 234의 10의 자리에 해당하는 1의 개수는 ((234/100)+1)*10이 됩니다. 여기서 +1은 해당 자리수의 수가 0이 아닌 경우에만 더해집니다. 예를 들어 204라면 ((204/100)+0)*10으로 30개가 아닌 20개가 됩니다. 이런 방식으로 234의 각 자리수의 1의 개수를 구하면 1의 자리에 해당하는 1의 개수는 ((234/10)+1)*1=24개가 되고 100의 자리에 해당하는 개수는 ((234/1000)+1)*100=100이 됩니다. 이들 세 수를 모두 합하면 24+30+100=154개가 됩니다. 한가지 추가로 생각해야 할 점은 제일 큰 자리의 수가 1인 경우 위의 공식이 아닌 다른 공식이 필요하다는 점입니다. 예를 들어 123에서 100의 자리에 해당하는 1의 개수는 ((123/1...

CodeHighlighter plugin test page.

This post is for testing CodeHighlighter plugin which uses GeSHi as a fontifier engine. ((Those code blocks are acquired from Google Code Search .)) ((For more supported languages, go CodeHighlighter plugin or GeSHi homepage.)) C++ (<pre lang="cpp" lineno="1">) class nsScannerBufferList { public: /** * Buffer objects are directly followed by a data segment. The start * of the data segment is determined by increment the |this| pointer * by 1 unit. */ class Buffer : public PRCList { public: Buffer() { ++index_; } PHP (<pre lang="php" lineno="4">) for ($i = 0; $i $value = ord( $utf8_string[ $i ] ); if ( $value < 128 ) { // ASCII $unicode .= chr($value); } else { if ( count( $values ) == 0 ) { $num_octets = ( $value } $values[] = $value; Lisp (<pre lang="lisp">) ;;; Assignment (define-caller-pattern setq ((:star var fo...

Coverity Prevent - 소스 코드 검사 도구

이번에 회사에서 소스 코드 검사 도구를 하나 구입하는데 이것저것 비교해본 결과 Coverity Prevent 라는 툴이 가장 좋아 이걸로 결정했다고 하더군요. 간단히 말하자면 Lint 처럼 소스 코드에 대해 static analysis를 하는 도구입니다. 그래서 시험삼아 돌려본 결과를 보게 되었는데 그 품질이 정말 놀랍군요. 메모리 릭이나 초기화하지 않은 변수, 버퍼 오버런, null 체크등등 거의 정확하게 에러를 보고해 줍니다. 다음은 전체 코드에서 발견된 문제점들을 리스트 형태로 보여주는 화면입니다. 정말 많군요. ;-) 다음은 이중 하나의 에러를 자세히 보기 위해 선택하여 들어간 화면입니다. 소스 코드에 라인번호와 에러가 발생한 위치, 에러가 발생할 수 있는 조건들을 자세히 보여줍니다. 정말 '와우!'입니다. 각 함수와 같은 이름들을 클릭하면 그 함수로 바로 이동할 수 있습니다. 사용해보니 개인적으로는 purify 같은 runtime 검사 도구보다 더 맘에 드는군요. 사실 Lint 계열의 도구들은 한번도 사용해본 적이 없는데 다른 것들도 한번 구해다 써봐야겠습니다. 이 툴의 유일한 문제는 비싸다는 것이랍니다. :-)