본문 바로가기
경영 전략 관련

Data Mining 이해

반응형
  1. Data Mining 정의 와 등장 배경
    1. 등장 배경
      1. 기술적요인
        1. 정보인프라 구축으로 인한 방대한 데이터
        2. 데이터 베이스를 통한 새로운 지식 창출 가능
        3. 기계학습기법의 급속한 발전
      2. 기업적 환경요인
        1. 경쟁력 있는 정보 분석 환경 출현
        2. Database Marketing의 지속적인 대두

    2. 정의
      1. Data Mining: "대용량의 데이터로부터 이들 데이터 내에 존재하는 관계, 패턴, 규칙 등을 탐색하고 찾아내어 모형화함으로써 유용한 지식을 추출하는 일련의 과정들"
      2. 통계적인 관점: "대용량 데이터에 대한 탐색적 데이터 분석(Exploratory Data Analysis for large amount data)"

  2. Data Mining 부각 이유
    1. 데이터마이닝은 대용량의 데이터를 다루는 것이 특징인데, 각 기업들의 운영 계에는 이제 분석을 수행하기에 충분한 용량의 데이터가 축적되고 있다. 실제로 데이터는 유례를 찾을 수 없이 급격히 증가하고 있으며, 수백 기가 바이트의 데이터베이스도 이제 흔한 현상이라 할 수 있다.
    2. 기업들 간의 경쟁이 가중되고 있다. 경쟁에 대한 압력은 기업이 대용량의 데이터에 대하여 높은 부가가치를 창출할 수 있는 데이터 웨어하우징이나 데이터 마이닝과 같은 분야에 대한 투자를 유도하고 있다.

  3. Data Mining 관련 분야
    1. KDD(Knowledge Discovery in Databases): 지식을 추출하는 전 과정을 의미하며, Data Mining은 KDD의 한 분야라고 할 수 있다.
    2. 기계학습(Machine learning): 인공지능의 한 분야로 자동적인 학습 기법을 설계하고 구현하는 분야.
    3. 패턴인식(Pattern recognition): 데이터베이스에서 유용한 패턴을 찾아내는 다양한 기법을 제공한다.
    4. 통계학(Statistics): Data Mining의 대부분은 통계학의 한 분야라고 할 수 있다.
    5. 뉴로컴퓨팅(Neurocomputing): 신경망등과 관련된 다양한 학문적 배격을 가진 한 분야이다.



  4. 절차에 따른 통계적 기법


  5. Data Mining 의 기법에 따른 적용사례

기법

기본 개념

적용 사례

  1. 연관 규칙

데이터간의 연관규칙을 찾아내는 기법

백화점, 잡화점

웹페이지의 디자인

  1. 순차 패턴

순서대로 일어난 데이터를 분석해 빈도수가 높은 순차 패턴을 찾아내는 기법

홈쇼핑 회사

학습지 회사

병원진료

  1. 분류 규칙

기존의 분류된 데이터를 이용, 새로운 데이터가 어느 클래스에 속하는지 예측하는 기법

슈퍼마켓

새로운 의약품 개발

전자상거래 사이트

  1. 군집화

전체 데이터의 분포나 패턴 등을 찾아내는 기술

백화점 고객 관리

  1. 아웃라이어

소수 또는 일부를 찾아내는 기술

신용카드 도둑

시스템 불법 침입자

  1. 의사 결정 나무

                       

  1. 신경망

  2. 동시발생 매트릭스


  1. Data Mining 활용분야
    1. 데이터베이스 마케팅(Database Marketing): 목표 마케팅(Target Marketing), 고객 세분화(Segmentation), 고객 성향 변동 분석(Churn Analysis), 교차 판매(Cross Selling), 시장바구니 분석(Basket Market Analysis)등에서 주로 이용
    2. 품질개선: 병원과 의료보험 조합 등에서는 병원에서 발생하는 사망, 불필요한 장기입원 및 의료비의 과다청구에 초점을 맞추고 있으며, 제조업체에서는 제품보증청구를 유발시키는 불량품 감소를 통한 이윤 증가에 중점
      위험관리(Risk Management), 망 관리(Network Management), 수요 및 판매 예측(Forecasting)등에 활용
    3. 신용평가: 은행, 금융서비스, 저당권보험(담보부보험), 소매(할부판매)등 다양한 분야에 적용
    4. 부정행위의 적발: 은행에서는 발견된 패턴을 이용하여 신용카드 거래사기 및 불량수표를 적발할 수 있고, 통신 회사에서는 진화 카드 거래 사기를 방지하며, 보험 회사에서 하는 허위 및 과다 청구를 예방
    5. 이미지분석: 천문학, 문자인식, 의료진단, 방위산업 등 다양한 분야에서 활용
    6. 통신회사: 확보된 고객의 이탈방지 하고 장기간 유지하기 위해 서비스 해지 가능성이 높은 이탈고객을 예측(chum모델링)
    7. 금융:
      1. 훔친 신용카드 사용의 패턴 탐지
      2. 신용카드를 다른 은행으로 옮길 가능성이 높은 고객의 예측
      3. 과거의 주식시장의 역사를 보고 이익을 볼 수 있는 주식 투자 방법의 발견
    8. 신용카드 회사:
      1. 불량고객을 가려내는데 이용
      2. 분식이나 도난 카드에 의한 사고 방지


Seri 펌
반응형