데이터마이닝의 원리와 구현 : R과 함께

데이터마이닝의 원리와 구현 : R과 함께

  • 자 :전치혁, 이혜선, 이영록, 이종석
  • 출판사 :자유아카데미
  • 출판년 :2024-11-26
  • 공급사 :(주)북큐브네트웍스 (2025-02-26)
  • 대출 0/3 예약 0 누적대출 2 추천 0
  • 지원단말기 :PC/스마트기기
  • 신고하기
  • 대출하기 추천하기 찜하기
  • qr코드

우선 이 책의 근간이 된 것은 첫 저자(전치혁)가 10여 년 전에 저술한 ‘데이터마이닝 기법과 응용’이라는 점을 밝히고자 한다. 이 책은 데이터마이닝의 주요 기법에 대한 이론을 쉽게 이해할 수 있는 책을 만들자는 목적으로 저술되었다. 최근 이 분야에서 공동 연구를 수행해 왔던 공저자들, 이혜선 교수, 이영록 박사, 이종석 교수로부터 데이터마이닝 기법의 구현을 포함시키면 좋겠다는 의견을 수렴하게 되었으며, 이에 데이터마이닝 기법을 일부 추가하고 R 언어로 코드 작성하는 등 1년간의 공동 작업으로 책을 완성하게 되었다.



최근 ChatGPT의 등장과 활발한 적용 사례를 접하게 되면서 인공지능(AI)에 대한 관심이 고조되고 있으며, 이와 함께 머신러닝 및 데이터마이닝 기법의 알고리즘 구현 과정 이해의 필요성이 증대하게 되었다. 이 책을 통해 이러한 궁금점을 해결할 수 있도록 각 기법의 원리를 보다 쉽게 이해할 수 있도록 설명하였으며, 데이터와 R 코드를 통해 구현 방법을 습득할 수 있게 서술하였다. 또한 Python 사용자들을 위해 교재에 포함되지 않은 Python 코드를 별도로 제공하고 있다.



데이터마이닝 기법은 목적에 따라 크게 예측, 분류분석, 군집분석, 연관규칙으로 나눌 수 있는데, 이 책에서도 이러한 순서에 따라 내용을 전개하였다. 먼저, 예측기법으로는 회귀분석, 규제 회귀분석, 차원축소 회귀분석을 다루며, 분류분석에서는 로지스틱 회귀분석, 판별분석, 트리 기반 기법, 서포트 벡터 머신, 앙상블 기법을 설명한다. 여기서 앙상블 기법에서는 랜덤 포레스트, 아다부스트, 그레디언트 부스트 등을 포함한다. 다음으로 군집분석을 다루는데, 계층적 군집분석과 비계층 군집분석으로 구분하여 계층적 군집분석에서는 주로 연결법을 설명하고 비계층 군집분석에서는 K-means, K-medoids, 퍼지 K-means, 모형기반 군집 방법, 디비스캔(DBSCAN) 등을 소개한다. 이어서 연관규칙과 추천시스템을 다루는데, 연관규칙은 다른 데이터마이닝 서적에서 구체적인 알고리즘을 소개하지 않고 있지만, 데이터로부터 유용한 구매패턴을 찾는 기법으로 고객 마케팅에 많이 활용된다. 추천시스템은 연관규칙과는 다소 목적이 다르나 사용자들이 제품을 평가하는 특성을 서로 연관시키는 면에서 공통점을 찾을 수 있는 방식이라고 할 수 있다.



이 책에서는 데이터마이닝 기법의 알고리즘 원리와 함께 실제 예제를 많이 수록하였다. 각 기법을 소개한 후 데이터 예제로 기법을 쉽게 이해할 수 있도록 하였으며, 앞서 언급한 바와 같이 코드를 삽입하여 독자들이 해당 기법을 직접 구현하고 결과를 확인할 수 있도록 구성하였다.



실습용 데이터파일, R과 Python 코드는 자유아카데미 홈페이지(www.freeaca.com) 자료실에서 제공하고 있으며, 출간 후에 발견되는 수정사항이나 제안은 출판사를 통해 저자들에게 전달이 가능하니 참고하기를 바란다.

지원단말기

PC : Window 7 OS 이상

스마트기기 : IOS 8.0 이상, Android 4.1 이상
  (play store 또는 app store를 통해 이용 가능)

전용단말기 : B-815, B-612만 지원 됩니다.
★찜 하기를 선택하면 ‘찜 한 도서’ 목록만 추려서 볼 수 있습니다.