분석을 시작하기 전에 각 사용자가 구매에서 최종 상환에 이르는 대출 업무 프로세스를 이해해야 합니다. 일반적으로, 인터넷 대출 과정은 다음과 같이 요약할 수 있다.
사용자 행동 경로 분석을 통해 다음과 같은 이점을 얻을 수 있습니다.
제품 운영의 핵심 부분을 분석하고 모니터링하며, 취약점을 찾고, 사용자 안내 또는 제품 반복을 통해 최적화하여 개조 효과를 높이는 데 적합합니다.
하위 집합을 선택하여 매일 대출을 신청하고 대출을 승인하는 신규 사용자와 기존 사용자 수를 집계한 다음 신규 사용자의 대출 비율을 계산합니다. 마지막으로 병합 기능을 사용하여 새 사용자 결과 테이블을 이전 사용자 결과 테이블과 결합합니다. 결과는 다음과 같습니다.
다음으로, 우리는 사용자의 상환율을 계산하기 위해 매일 오래된 사용자의 수를 알아야 한다. 여기서 기존 사용자의 정의는 # 전날에 대출하고, 다음날에 계속 빌려주는 신규 사용자는 기존 사용자 # 입니다. 기존 사용자의 경우, 우리는 잠시 고려하지 않고, 전날에 빌린 사람이 다음날에 계속 대출을 할 것인지의 여부만 보고, 이 대출은 기존 사용자의 대출 상환으로 간주되기 때문에, 우리는 새 사용자의 대출 피벗 테이블 29 일 전 데이터 +5 월 1 의 인원 구성을 취한다.
각 노드의 전환율을 계산하는 사용자 경로 요약 테이블을 형성합니다.
변환 깔때기를 계산하고 요약 데이터를 계산하려면 다음을 수행합니다.
결과는 다음과 같습니다.
결과적으로 PV 에서 UV 로 크게 떨어졌습니다. 일반적으로 광고는 10%-30% 정도의 사용자를 끌어들일 수 있지만 클릭량이 매우 커서 이 결과가 발생합니다.
전반적으로 4% 의 등록자 수가 비교적 낮다는 것은 분명합니다. 즉, 사용자가 많이 클릭했지만 등록자 수가 적다는 뜻입니다. 이 채널에 문제가 있음을 의미합니까? 다른 채널의 전환 깔때기 분석을 비교하여 전체 업계의 전환률이 낮은지, 단일 채널이 낮은지, 아니면 이 채널 사용자 그룹이 우리가 원하는 것이 아닌지 확인할 수 있습니다.
소비금융회사에서는 흔히 일상적인 감시를 통해 어떤 소비대출 상품의 초과율이 점차 상승하고 있다는 것을 발견할 수 있다. (윌리엄 셰익스피어, 윈스턴, 소비금융, 소비금융, 소비금융, 소비금융, 소비금융, 소비금융) 우리는 제품의 손실을 줄이기 위해 한 번의 합격률을 낮춰야 하며, 동시에 합격률도 너무 뚜렷하지 않아야 한다.
분석 목표: 데이터 탐색 및 분석을 통해 1 회 통과율을 효과적으로 낮출 수 있는 전략을 개발합니다.
분석 아이디어: 우리가 분석할 전략은 신청 시 고객이 연체되는지 여부를 판단하는 데 사용되기 때문에, 전략 분석의 기본 아이디어는 최초 실적이 있는 고객의 신청 시 데이터를 복원하는 것입니다 (이 복원은 고객이 신청할 때 각 차원의 데이터를 추출하는 것을 의미합니다. 많을수록 좋습니다). 그런 다음 이 데이터를 사용하여 좋고 나쁨을 구분할 수 있는 변수를 찾아 전략을 개발합니다.
전체 1 차 합격률은 30.76% 로 나올 수 있다.
여기에 사용된 것은 단변수 분석 방법이다. 단변수 분석의 주요 목적은 좋고 나쁨을 구분하는 변수를 선별하여 전략을 세우는 것이다. 김회사의 일상 업무에서는 변수를 잡고 처리 변수의 데이터를 계산하는 팀이 있다. 이들은 끊임없이 풍제어에 도움이 될 수 있는 많은 데이터를 입수하고 처리하고 있으며, 우리의 풍조팀은 많은 좋은 고객을 잘못 거절하지 않고 이 수천 개의 변수에서 연체위험을 통제할 수 있는 변수를 찾아내야 한다.
통계 결과는 다음과 같습니다.
통계 결과는 다음과 같습니다.
변수 분석 후, 이 시점에서 보다 효과적인 변수를 선택합니다. 여기에는 변수가 유효한지 여부를 측정하는 지표와 진급도가 포함됩니다. 일반적으로 최악의 고객 중 일부를 거부한 후 전반적인 바람 제어의 개선 효과를 측정하는 것이다. 승천 정도가 높을수록 변수는 좋은 고객과 나쁜 고객을 효과적으로 구분할 수 있고, 좋은 고객을 잘못 거절할 가능성은 적다. 아래와 같이 모든 변수의 상승도를 역순으로 배열하여 개인 신용 조회수와 고객 신용 등급이 각각 1.93 과 1.7 1 으로 가장 높은 것으로 나타났습니다.
이전 단계의 단변수 분석을 통해 "신용 조회 수" 와 "신용 등급" 이라는 가장 개선된 두 가지 변수를 선별했습니다. 이 두 변수가 가장 낮은 고객을 거부하면 전체 연체에 미치는 영향은 다음과 같습니다. 이 영향은 우리가' 총 신용 조회 수 > 를 가정한다는 것을 의미합니다. 3,265,438+03 고객 = 265,438+0 이 모두 거부된 후, 나머지 고객의 연체율은 거부 전보다 낮아졌다. 마지막으로 우리가 얻은 것은 신용조회량이 3.4% 하락했고 신용등급이 7.5% 하락했다는 것이다.
사용자는 제품을 사용하는 과정에서 사용자 행동 과정을 거치며, 기간마다 사용자의 표현이 다를 수 있습니다. 집단 분석의 주요 목적은 시간에 따른 유사 집단의 변화를 분석하는 것이다. 핵심은 같은 시기에 서로 다른 시간에 그룹 사용자의 행동 차이를 비교 분석하는 것이기 때문에 동시 집단 분석이라고도 한다.
그렇다면 금융풍통제 분야에서 가장 많이 사용되는 시나리오는 노화 분석으로 사용자의 연체율 변화를 모니터링하는 데 사용된다. 아래 그림에서 M2 와 M3 의 연체율은 비교적 높습니다. 그런 다음 바람 제어 전략을 조정하고 그룹화 분석을 수행하여 전략이 유효한지 확인합니다.
결과는 다음과 같습니다.
여기에 생성된 새 필드, 주문 기간 (orderperiod) 은 사용자가 주문한 달이고, cohortgroup 은 각 사용자가 주문한 가장 빠른 시기에 따라 사용자 그룹을 생성하는데, 둘 다 다르다.
다음으로 사용자 그룹 및 월 필드별로 그룹화합니다.
결과는 다음과 같습니다.
Orderperiod 필드에서 20 19-0 1 해당 최초 소비월은 2009-0 1, 02,03,000 임을 알 수 있습니다
가져오기:
그래서:
위 그림의 각 열은 해당 월의 가장 이른 소비자 그룹을 나타내고, cohortperiod 는 1, 2,3,4 월 가장 이른 소비자 그룹을 나타냅니다. 예를 들어 20 19-0 1 은 1 월 중 가장 이른 소비자 그룹의 1, 2, 3, 4 월을 나타냅니다.
결론적으로:
동일한 수명 주기 단계의 사용자에 대한 수직 분석을 통해 시간에 따른 유사 집단의 변화를 비교할 수 있습니다. 위 그림에서 볼 수 있듯이 사용자 유지율은 시간이 지남에 따라 감소합니다.
동시에, 서로 다른 시간의 동시팀을 비교해 보면 보유율이 높고 낮은 것을 알 수 있다. 위 그림에서 볼 수 있듯이 2065438 년 2 월 하락했고 2065438 년 4 월 또 올랐다.
20 19-03 에서 사용자 활동으로 인해 이러한 결과가 발생할 수 있으며, 이를 통해 활동 향상이 뚜렷한 효과를 거두었음을 확인할 수 있습니다.