데이터베이스 측면에는 DB2, Oracle, SQL 서버, Teradata, 그리고 Redbrick 이 있습니다 (IBM 이 편성한 후 역사 무대를 종료함).
Datastage, Powercenter 등의 ETL 도구는 주류입니다. 또한 많은 기업들이 SAS 의 ETL 서버, BO 의 Data Integrator 와 같은 자체 ETL 제품을 보유하고 있습니다.
OLAP 도구는 MOLAP (다차원 OLAP) 및 ROLAP (관계형 OLAP) 로 세분화될 수도 있습니다. 전자는 Hyperion, Cognos, Microsoft 제품을 선택할 수 있고, 후자는 선택의 여지가 크지 않다. 예를 들어, Microstrategy 는 현재 시장 점유율이 비교적 클 수 있으며, 이전에는 Redbrick 과 협력했습니다. 또한 Metacube 라는 ROLAP 도구도 있으며, 2000 년 초에 퇴출되었습니다.
데이터 마이닝 제품 분야에서는 SAS 와 SPSS 의 두 가지 주요 공급업체가 있으며 IBM 과 Teradata 도 자체 마이닝 도구를 보유하고 있습니다. 또한 보고서 서버와 프런트 엔드 도구에도 많은 옵션이 있습니다. 그중에서도 Cognos, BO, 브리오가 주류를 이루고 있습니다.
이 주류 상품들을 보면 대부분 수입한 것이다. 국내에도 BI 제품의 R&D 가 있어 완벽한 BI 솔루션은 많지 않지만, 특정 부분만을 위한 제품은 다양하며 대부분 ETL, 프런트 엔드, 데이터 마이닝 제품으로 제한된다. 하지만 최근에 나는 비교적 완벽한 BI 소프트웨어인 오비의 지능 있는 Power-BI 를 배웠는데, 이 소프트웨어는 서로 다른 업무 주제에 따라 10 여 개의 서버 분석 서비스를 기반으로 한 OLAP 큐브를 미리 설정해 놓았다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 남녀명언) 보고서 뿐만 아니라 성숙하고 실용적인 의사 결정 분석 모델이 있습니다. 가장 큰 특징은 설치 후 바로 사용할 수 있고, 실현할 필요가 없고, 매우 수월하다는 것이다. 그리고 가격이 비교적 친민이어서 명성이 그리 크지는 않지만 업계 내에서 입소문이 좋아 국내 중소기업 중 어느 정도의 시장 점유율이 있다.
현재 다양한 유형의 사용자에 대한 제품 선택 프로세스를 보면 다음과 같은 여러 가지 문제가 있습니다.
첫째, 나무가 바람을 쐬면 개별 도구의 비용만 낮출 수 있고 전체 비용은 무시할 수 있다. 일부 대기업들은 IT 건설에 많은 돈을 썼고, 제품 구입에 얼마나 많은 투자를 했는지는 전혀 신경쓰지 않는다. 모든 것이 최고입니다. 그러나 점점 더 많은 기업들이 비용을 고려하고 최대한 절약해야 한다. 데이터베이스와 OLAP 도구 외에도 ETL 과 프런트엔드를 직접 개발하면 돈을 절약할 수 있을지 고민했습니다.
그러나 문제는 단일 제품의 비용만 고려하고 프로젝트 종합 비용은 무시하면 결국 유지 관리가 어려운 절차에 시달릴 수도 있고, 심지어 완전히 전복될 수도 있다는 점이다. 재물이 많은 대기업들에게는 각 분야에서 가장 좋은 제품을 선택하더라도 조합하는 것이 반드시 가장 좋은 것은 아니다. (윌리엄 셰익스피어, 윈스턴, 돈명언)
두 번째는 평가 보고서가 객관적이지 않다는 것이다. 기업이 제품 선택을 담당하는 직원은 일반적으로 제조업체에 평가 보고서를 요청합니다. 보고서에는 몇 가지 옵션과 각각의 장단점이 나열되어 있으며, 마지막으로 자신에게 가장 적합한 결론을 도출해야 합니다.
만약 우리가 문자 그대로 이 보고서를 이해한다면, 한 제품의 어떤 방면이 더 좋은지, 어떤 방면이 좋지 않은지 아는 것은 객관적이지 않다. 제조업체에게 이것은 목록입니다. 물론, 그들은 자신의 제품의 장점을 과시하고 자신의 약점을 피하기 위해 최선을 다할 것이다. 한편, 선정을 담당하는 사람에게는 어떤 도구에 대해 진작에 호감을 가졌거나, 어떤 업체와의 관계가 좋았거나, 심지어 더 많은 거래까지 할 수 있었다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) 이런 상황에서 객관을 유지하는 것은 쉽지 않다.
요점을 선택하다
사실, 이러한 주류 제품을 선택, 우리 모두가 알고 있는 "아니 최고, 오직 가장 적합 합니다." 무엇이 가장 적합합니까? 앞서 언급한 배후 요인을 제외하면, 제품 비용, 개발자가 이 제품에 대해 얼마나 잘 알고 있는지, 비슷한 사례가 있는지 고려해야 할 세 가지가 있다.
먼저 원가를 보다. NCR, IBM 및 Oracle 은 전체 제품 라인을 보유하고 있지만 가격이 비쌉니다. 마이크로소프트의 제품은 비교적 싸지만, 만약 대량의 데이터가 있다면, 나는 감히 사용할 수 없을 것 같다. 돈을 쓰지 않는 오픈 소스 제품은 말할 것도 없다. 물론, 비용은 제품 자체의 가격에 의해서만 결정되는 것이 아니라, 아래 인원들이 공부하고, 프로젝트가 연기되고, 고객 만족도가 낮다. 이러한 숨겨진 비용은 계산하기가 어렵습니다. 비용에 관해서는 BI 모델을 언급하지 않을 수 없다. 왜냐하면 모델은 BI 제품 중 가장 비싼 부분이기 때문이다. 국내 기업들이 자주 개발하는 방식을 대량으로 채택하면 고비용을 피할 수 있지만 외국의 선진 경영 경험을 배울 수는 없다.
인원의 경험을 보다. 사람의 학습 곡선은 필연적이다. 사람이 신제품을 만지자마자 곧 대가가 될 수 있다고 상상하지 마라. 익숙하지 않은 제품을 바탕으로 좋은 구조를 만들 수 있다. 이 점에서 갑골문과 마이크로소프트가 우세한 것은 분명하다. 이 두 제품은 경험이 많은 사람들이 많기 때문에 쉽게 찾을 수 있기 때문이다. 물론 원래 비즈니스 시스템에서 이러한 제품 중 하나를 사용했다면 계속 사용하는 것이 좋습니다.
둘째, 사례는 백서보다 더 중요합니다. 현재 많은 BI 업체들이 종합적인 솔루션과 원스톱 서비스를 제공할 수 있습니다. IBM, Oracle, SAS 는 모두 이러한 전체 솔루션 공급업체라고 주장합니다. 즉, 제품 라인에는 데이터베이스, OLAP, ETL 등의 다양한 도구가 포함되어 있습니다. 직접 선택하면 도구 선택에 대해 걱정할 필요가 없지만, 어떤 경우에는 여러 가지 이유로 제품을 사용하지 않기로 결정할 때 호환성 여부를 고려해야 합니다. 그러나 제품 백서에서 이러한 정보를 찾으면 아름답다는 것을 알 수 있습니다. 어떻게 서로 완벽하게 "완벽하게" 호환되는지 알 수 있습니다. 하지만 그렇지는 않습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) 그러므로 이 단어들을 보지 말고, 같은 업계의 유사한 사례를 찾아야 한다. 같은 업종에 사례가 없다면, 다른 데이터량이 비슷하고, 업무복잡성이 비슷하며, 비슷한 업종 사례를 적용한다.