Skip to main content

XMLCPP Library 0.9

며칠간 뚝딱거려서 만든 XMLCPP Library의 최초 버전을 release하였습니다.

라이브러리의 홈페이지에서 간단한 사용법을 보실 수 있습니다.

라이브러리가 지원하는 표준은 다음과 같습니다.


  1. XmlPull v1 API

  2. XML InfoSet의 모든 문법

  3. XML Namespaces

  4. XML Recommendation에 정의된 CharClasses



현재 DTD를 사용한 validation은 구현되어 있지 않습니다. 간단히 말하면 non-validating XML pull parser입니다. 물론 DTD에 대한 문법 검사는 수행합니다. ((이 기능은 Roadmap에 따라 차후 구현될 예정입니다.))

Entity ref를 위한 name/value pair는 XmlPull v1 API에 정의되어 있는 define_entity_replacement_text(name, text)를 사용하여 수동으로 입력하여 사용할 수 있습니다.

Requirements



이 XMLCPP Library를 사용하기 위해서는 다음의 두 라이브러리가 필요합니다. ((둘 다 Windows 환경에서도 사용 가능합니다만 아직 Windows로의 포팅 작업은 이루어지지 않았습니다. Roadmap 부분을 참고하세요.))


  1. Boost C++ Library

  2. libiconv



Usage



구현된 PullParser의 간단한 사용예는 다음과 같습니다.


using namespace xmlcpp;

try {
fstream fs(filename);
fs.exceptions (ios_base::badbit);

PullParser pp;
pp.set_input(fs, encoding);

while (pp.next() != PullParser::END_DOCUMENT) {
wcout << PullParser::event_type_c_str(pp.get_event_type()) << L": " << endl;
switch (pp.get_event_type()) {
case PullParser::START_TAG:
wcout << L"tname="" << pp.get_name() << L""" << endl;
for (int i = 0; i < pp.get_attr_size(); ++i) {
wcout << L"tt" << pp.get_attr_name(i)
<< L"="" << pp.get_attr_value(i) << L""" << endl;
}
break;
case PullParser::END_TAG:
wcout << L"tname="" << pp.get_name() << L""" << endl;
break;
case PullParser::TEXT:
wcout << L"ttext="" << pp.get_text() << L""" << endl;
break;
default:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
}
}

wcout << L"END_DOCUMENT: " << endl;
}
catch (exception& ex) {
wcout << ex.what() << endl;
}


위의 코드는 PullParser의 next()함수를 사용한 것으로 next()함수는 다음 4개의 event_type만 리턴합니다.


  1. START_TAG

  2. TEXT

  3. END_TAG

  4. END_DOCUMENT



next()함수에서는 "<ABC>"라는 문자열은 하나의 TEXT event로 리턴되며 get_text()의 값은 ""가 됩니다.

next() 함수보다 좀 더 자세한 내용이 필요하다면 next_token()함수를 사용할 수 있습니다. 이 함수는 next()가 리턴하는 event_type에 더해 다음을 추가로 리턴합니다.


  1. START_DOCUMENT

  2. IGNORABLE_WHITESPACE

  3. CDSECT

  4. PROCESSING_INSTRUCTION

  5. COMMENT

  6. ENTITY_REF

  7. DOCDECL



위에서 예를 든 "<ABC>"라는 문자열은 next_token()함수를 사용하면 ENTITY_REF, TEXT, ENTITY_REF 이렇게 3개의 event_type으로 나누어져서 리턴됩니다. 각 ENTITY_REF event의 경우에는 get_raw_text()에서는 "<"를, get_text()에서는 "<"을 리턴합니다. ENTITY_REF이 유일하게 get_raw_text()와 get_text()가 다른 값을 리턴하는 event_type입니다.


using namespace xmlcpp;

try {
fstream fs(filename);
fs.exceptions (ios_base::badbit);

PullParser pp;
pp.set_input(fs, encoding);

while (pp.next_token() != PullParser::END_DOCUMENT) {
wcout << PullParser::event_type_c_str(pp.get_event_type()) << L": " << endl;
switch (pp.get_event_type()) {
case PullParser::START_DOCUMENT:
wcout << L"tversion="" << pp.get_version() << L""" << endl;
wcout << L"tencoding="" << pp.get_encoding() << L""" << endl;
wcout << L"tstandalone"" << pp.get_standalone() << L""" << endl;
break;
case PullParser::START_TAG:
wcout << L"tname="" << pp.get_name() << L""" << endl;
for (int i = 0; i < pp.get_attr_size(); ++i) {
wcout << L"tt" << pp.get_attr_name(i)
<< L"="" << pp.get_attr_value(i) << L""" << endl;
}
break;
case PullParser::END_TAG:
wcout << L"tname="" << pp.get_name() << L""" << endl;
break;
case PullParser::TEXT:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
case PullParser::IGNORABLE_WHITESPACE:
break;
case PullParser::CDSECT:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
case PullParser::PROCESSING_INSTRUCTION:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
case PullParser::COMMENT:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
case PullParser::ENTITY_REF:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
case PullParser::DOCDECL:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
default:
wcout << L"ttext="" << pp.get_raw_text() << L""" << endl;
break;
}
}

wcout << L"END_DOCUMENT: " << endl;
}
catch (exception& ex) {
wcout << ex.what() << endl;
}


Roadmap



현재 Linux 환경에서만 test되었으며 다음과 같은 roadmap을 가지고 작업할 예정입니다.


  1. XmlPull v1 API의 Serializer 구현 (writing XML)

  2. MS VC++에서 사용 가능하도록 포팅

  3. DTD를 이용한 validation 구현

  4. PullParser를 이용한 SAX parser 구현

  5. SAX parser를 이용한 DOM 구현

  6. DOM을 이용한 XPath 및 기타 기능 구현



Downloads



다운로드는 여기서 할 수 있습니다.

Help Wanted



XMLCPP Library 개발에 관심 있으신 분들은 참여해 주세요. 특히 현재 위의 2번 항목 VC++로의 포팅에 도움이 필요할 듯 합니다. 한번 해봤는데 오랫만에 VC++를 사용하려니 잘 안되더군요. :-| 참고로 libiconv 라이브러리는 Windows용도 있습니다.

Comments

Popular posts from this blog

1의 개수 세기

저도 간단한 알고리즘 문제 하나... :-)

어떤 수 n이 주어졌을때 1~n까지의 수를 쭈욱 썼을때 나오는 1의 개수를 구하는 문제입니다.

예를 들어 13이라는 수가 주어지면 1~13까지의 수 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13에서 1은 1, 10, 11, 12, 13에 나오며 그 개수는 6이 됩니다. 즉, f(13)=6.

원래 문제는 f(n)=n이 되는 1이 아닌 가장 작은 수를 구하는 문제인데 이 문제의 경우에는 처음부터 쭈욱 세어나가면 되기 때문에 간단히 다음과 같이 구현을 하면 됩니다. ((한가지 주의할 점은 이전에 찾았던 n-1값을 사용하지 않고 다시 처음부터 n까지 값을 계산하면 시간이 너무 많이 걸린다는 점입니다. 위의 코드에서는 static 변수를 사용하여 이전 값에 계속 더해나가는 방법을 사용했습니다.))


#include

int count1(int n)
{
static int cnt = 1; // not 0 because n starts from 2. see main.

while (n > 0) {
if ((n % 10) == 1) ++cnt;
n /= 10;
}

return cnt;
}

int main()
{
using namespace std;

int n = 2;

while (count1(n) != n) ++n;
cout << n << endl;
}


좀 재미가 없죠? 그래서 이번 문제는 어떤 수 n에 대해서 f(n)을 O(1)시간에 구하는 알고리즘을 만드는 것입니다. 관심있으신 분들은 한번 풀어보세요. 제가 만든 코드는 내일 올려보겠습니다.

C++ of the Day #9 - Boost.Python 사용하기 #1

Python은 가장 인기있는 interpret 언어중의 하나입니다. Python의 장점 중 하나는 C/C++ 모듈과 쉽게 연동할 수 있다는 점입니다. 물론 손으로 일일히 wrapper를 만드는 것은 손이 많이 가고 에러를 만들수 있는 작업이나 SWIG등과 같은 도구를 사용하면 쉽게 python 모듈을 만들 수 있습니다.

Boost.Python은 이런 SWIG와 같이 python 모듈을 쉽게 만들 수 있도록 도와주는 라이브러리로 순수 C++만을 사용한다는 점이 SWIG와 다른 점입니다. 그리고 개인적으로는 Boost 라이브러리에 포함되어 있는 것들이 왠지 좀 더 믿음직스러워서... :-)

이번 글에서는 Boost.Python 문서에 나와 있는 예제를 가지고 간단하게 python 모듈을 만드는 방법에 대해서 알아보겠습니다.

Requirements리눅스
이 글에서는 리눅스 환경에서의 사용 방법을 설명한다.Boost.Python 라이브러리 (1.33.1)
Boost 라이브러리를 다운로드받아 아래와 유사한 명령으로 라이브러리를 빌드한다.
bjam -sTOOLS=gcc -with-python install

bjam의 --prefix 옵션으로 라이브러리가 설치될 위치를 변경할 수 있다.Python 라이브러리 (2.4.3)
Python을 다운로드 받아 빌드하여 설치한다.
위의 경우와 유사하게 configure의 --prefix 옵션으로 설치될 위치를 변경할 수 있다.

Write C++ Code다음과 같이 코드를 작성한다.

// greet.cpp #include <stdexcept> char const* greet(unsigned x) { static char const* const msgs[] = { "hello", "Boost.Python", "world!" }; if (x > 2) throw std::range_error("greet: index out of range"…

Hello Wordpress, again.

한 두주일 정도 Textpattern을 사용해봤는데 다시 Wordpress로 돌아오기로 결정했습니다. 무엇보다 스킨 변경이 너무 복잡하고 사용자층이 Wordpress에 비해 너무 앏네요. 원하는 plugin도 찾기 어렵고... :-|

그동안 Textpattern에 썼던 글들은 모두 Wordpress로 옮겼습니다. 2개 있던 댓글도 옮겼는데 그중의 하난 제가 쓴... ;-)

애초에 wp-dokuwiki plugin이 무거워서 옮겼던 것이라 이 plugin은 설치를 안할 예정인데 몇가지 아쉬운 점이 있네요.

첫째는 code highlighting 기능인데 이 기능은 예전에 만들어 놨던 것을 조금 수정해서 쓰려고 준비중입니다. 두번째는 Footnote 기능인데 찾아보니 Footnotes 0.9 Plugin for WordPress 2.0.x라는게 있네요.

이정도면 비록 wiki syntax에 비할바는 아니지만 쓸만할 것 같습니다. :-)