간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~31권3호(2018) |수록논문 수 : 1,761
응용통계연구
31권3호(2018년) 수록논문
최근 권호 논문
| | | |

KCI등재

1다중요인분석을 이용한 부분 최소제곱 경로 모형에 대한 고찰

저자 : 박리라 ( Ri-ra Parka ) , 이은경 ( Eun-kyung Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 315-328 (14 pages)

다운로드

(기관인증 필요)

초록보기

다중요인분석은 관능검사에서 주로 이용되는 분석으로 상품의 속성과 소비자들의 기호도에 대한 자료 분석에 주로 이용된다. 본 연구에서는 다중요인분석을 상품의 속성, 소비자들의 기호도 등의 자료에 이용하여 소비자들의 특성에 따라 몇 개의 군집으로 분류하고 이를 부분 최소제곱 경로모형을 이용하여 분류된 군집의 특성을 파악해 보고자 한다. 향수의 속성에 대한 자료와 소비자들이 파악한 향수의 속성, 그리고 그들의 기호도에 관한 실제 자료를 다중요인분석을 이용하여 살펴보고 이 결과를 이용하여 소비자들을 4개의 군집으로 분할한다. 분할한 군집별로 제품의 특성을 파악하고 이를 최소제곱경로모형에 적용하여 각 군집의 특성을 나타내는 잠재변수를 추정, 군집별로 소비자들이 선호하거나 기피하는 제품의 특성들, 그리고 각 군집별로 제품들을 어떻게 지각하는지 등을 파악한다. 다중요인 분석을 활용한 부분 최소제곱 경로모형은 제품에 대한 특성과 소비자들의 기호도를 동시에 분석하여 이들의 관계를 규명하고 분석 결과를 제품 개발과 판매에 적용할 수 있다는 점에서 유용한 모형이라고 할 수 있다.


In this paper, we examine the methodology to predict consumer preferences using several groups of attributes of products and application to real data. In the food industry, studies are in progress to investigate the relationship between product attributes and consumer preferences; consequently, various methodologies are proposed. Among these methodologies, we consider multiple factor analysis (MFA). The result of the MFA enable the division of consumers into four clusters with similar liking and the defining of preference characteristics for each cluster. Also, using the results of multiple factor analysis, we find the partial least squares path model to predict consumer preferences through the characteristics of the product and the characteristics evaluated by consumers. We can understand the relationship between the cluster of consumers and the preferred/undesirable characteristics of products through the partial least squares path model applied to two clusters with different liking. When multiple factor analysis is used in the partial least squares path model, it is possible to investigate relationships between products and consumers by analyzing product characteristics and consumer preferences simultaneously. The results can be applied to product developments and sales which makes this methodology important and useful.

KCI등재

2만성 폐쇄성 폐질환을 이용한 노모그램 구축과 비교

저자 : 서주현 ( Ju-hyun Seo ) , 이제영 ( Jea-young Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 329-342 (14 pages)

다운로드

(기관인증 필요)

초록보기

노모그램은 질병의 위험 요인과 예측 확률을 쉽게 이해할 수 있도록 시각적으로 표현하는 통계적 도구이다. 본 논문은 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)의 위험 요인을 이용하여 로지스틱 회귀모형과 순수 베이지안 분류기 모형의 노모그램을 구축하고 이를 비교하였다. 분석 데이터는 국민건강영양조사 6기(2013-2015)를 이용하여 진행하였다. 총 6개의 위험 요인을 이용하였다. 그리고 로지스틱 회귀모형, 순수 베이지안 분류기 모형과 각각의 구축 방법을 이용하여 만성 폐쇄성 폐질환의 노모그램을 제시하였다. 또한, 구축된 두 노모그램을 비교하여 유용성을 살펴보았다. 마지막으로 ROC curve와 Calibration plot을 통하여 각 노모그램을 검증하였다.


Nomogram is a statistical tool that visualizes the risk factors of the disease and then helps to understand the untrained people. This study used risk factors of chronic obstructive pulmonary disease (COPD) and compared with logistic regression model and naive Bayesian classifier model. Data were analyzed using the Korean National Health and Nutrition Examination Survey 6th (2013-2015). First, we used 6 risk factors about COPD. We constructed nomogram using logistic regression model and naive Bayesian classifier model. We also compared the nomograms constructed using the two methods to find out which method is more appropriate. The receiver operating characteristic curve and the calibration plot were used to verify each nomograms.

KCI등재

3평률 회귀분석을 위한 추정 방법의 비교

저자 : 김종민 ( Jong Min Kim ) , 강기훈 ( Kee-hoon Kang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 343-352 (10 pages)

다운로드

(기관인증 필요)

초록보기

설명변수가 주어졌을 때 반응변수의 평균적인 추세뿐만 아니라 극단적인 지역에서의 추세에 대해서 추정하고 싶거나 반응변수 분포의 일반적인 탐색을 위해서는 분위수 회귀분석과 평률 회귀분석을 사용할 수 있다. 본 논문에서는 평률 회귀모형의 추정을 위한 모수적 방법과 비모수적 방법의 성능을 비교하고자 한다. 이를 위해 각 추정 방법을 소개하고 여러 상황의 모의실험 및 실제자료에의 적용을 통해 비교 분석을 실시하였다. 모형에 따라 성능 차이가 있는데 자료의 형태가 복잡하여 변수 간의 관계를 유추하기 힘들 경우 비모수적으로 추정한 평률 회귀분석모형이 더욱 좋은 결과를 보였다. 일반적인 회귀분석의 경우와 달리 평률의 경우 후보가 되는 모수 모형을 상정하기 어렵다는 측면에서 볼 때, 비모수적 방법의 사용이 추천될 수 있다.


We can use quantile regression and expectile regression analysis to estimate trends in extreme regions as well as the average trends of response variables in given explanatory variables. In this paper, we compare the performance between the parametric and nonparametric methods for expectile regression. We introduce each estimation method and analyze through various simulations and the application to real data. The nonparametric model showed better results if the model is complex and difficult to deduce the relationship between variables. The use of nonparametric methods can be recommended in terms of the difficulty of assuming a parametric model in expectile regression.

KCI등재

4선형혼합모형을 이용한 피부움직임 오차의 예측

저자 : 김진욱 ( Jinuk Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 353-366 (14 pages)

다운로드

(기관인증 필요)

초록보기

영상에 의한 인체의 운동 분석에서 발생하는 오차 중 가장 큰 부분을 차지하는 것은 피부와 같은 연조직의 골격에 대한 상대운동이며 이를 STA라 한다. 본 연구의 목적은 고관절 운동 중 대퇴에서 발생하는 STA를 선형혼합모형을 이용하여 예측하는 것이다. 모형에 포함되어 있는 고정효과는 고관절 회전중심과 마커의 위치로 대퇴 골격에 의한 운동의 효과, 임의효과는 고관절 중심으로부터 각 마커의 편차로 STA에 의한 효과로 각각 가정하였다. 이를 위하여 근골격계 질환 경력이 없는 다섯 명의 남성 피험자를 선정하여 대퇴에 아홉 개의 마커를 부착하여 고관절의 기능적 운동을 수행하였다. 동시에 고속카메라를 이용하여 마커의 3차원 좌표를 얻었다. 이 3차원 위치벡터에 선형혼합모형을 적용하여 임의효과를 예측하였다. 분석결과 다섯 명의 피험자는 비슷한 패턴을 보였다. 고관절에 가까운 지점의 STA가 큰 것으로 나타났으며 작은 크기를 보인 부분은 원위 대퇴의 전방이다.


This study uses mixed-effects models to predict thigh soft tissue artefact (STA), relative movement of soft tissue such as skin to femur occurring during hip joint motions. The random effects in the model were defined as STA and the fixed effects in the model were considered as skeletal motion. Five male subjects without musculoskeletal disease were selected to perform various hip joint rotational motions. Linear mixed-effects models were applied to markers' position vectors acquired from non-invasive method, photogrammetry. Predicted random effects showed similar patterns of STA among subjects. Large magnitudes of STA appeared on the points near the hip joint regardless of sides; however, small values appeared on the distal anterior.

KCI등재

5국내 회사채 신용 등급 예측 모형의 비교 연구

저자 : 박형권 ( Hyeongkwon Park ) , 강준영 ( Junyoung Kang ) , 허성욱 ( Sungwook Heo ) , 유동현 ( D

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 367-382 (16 pages)

다운로드

(기관인증 필요)

초록보기

회사채 신용 등급 예측 모형에 대한 연구는 신용 평가 기관이 회사채 신용 등급 평가에 사용될 것이라 예상 되는 여러 재무적 특성 변수들을 기반으로 진행되었으며 선형 회귀 모형(linear regression), 순위 로짓(ordered logit), 순위 프로빗(ordered probit), 서포트 벡터 기계(support vector machine), 랜덤 포레스트(random forest) 등 다양한 모형들을 적용하여 개발되었다. 하지만 기존 연구들에서 고려한 회사채 신용 등급은 연구에 따라 5등급에서 20등급까지 다른 등급 구간을 적용하였으며 분석에 이용된 표본 자료의 기간 및 대상도 상이하여 예측 성능의 공정한 비교에 어려움이 있다. 따라서 본 연구에서는 2013년부터 2017년까지의 회사채 신용 등급 자료와 기존 연구들에서 사용된 재무 지표들을 통합하여 기존에 발표된 예측 모형들을 동일한 자료에 적용하고 예측 성능을 비교하였다. 추가적으로 Elastic-net 벌점화 회귀 모형 및 순위 로짓, 순위 프로빗 모형을 적합하여 LASSO 벌점이 선택됨을 확인하였으며 LASSO 벌점을 고려한 예측 모형이 대응하는 기존의 예측 모형들보다 향상된 성능을 보임을 확인하였다. 본 연구의 수행 결과, 랜덤 포레스트를 이용한 예측 모형이 15등급 기준 검증 자료에서 정확한 등급 예측률이 69.6%로 다른 모형과 비교하여 높은 예측 성능을 나타내었다.


Prediction models for a corporate bond rating in existing studies have been developed using various models such as linear regression, ordered logit, and random forest. Financial characteristics help build prediction models that are expected to be contained in the assigning model of the bond rating agencies. However, the ranges of bond ratings in existing studies vary from 5 to 20 and the prediction models were developed with samples in which the target companies and the observation periods are different. Thus, a simple comparison of the prediction accuracies in each study cannot determine the best prediction model. In order to conduct a fair comparison, this study has collected corporate bond ratings and financial characteristics from 2013 to 2017 and applied prediction models to them. In addition, we applied the elastic-net penalty for the linear regression, the ordered logit, and the ordered probit. Our comparison shows that data-driven variable selection using the elastic-net improves prediction accuracy in each corresponding model, and that the random forest is the most appropriate model in terms of prediction accuracy, which obtains 69.6% accuracy of the exact rating prediction on average from the 5-fold cross validation.

KCI등재

6평활량 선택문제 측면에서 본 중첩병렬화 상황에서 병렬처리 포인트선택

저자 : 조가영 ( Gayoung Cho ) , 노호석 ( Hohsuk Noh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 383-396 (14 pages)

다운로드

(기관인증 필요)

초록보기

빅데이터의 시대가 열림에 따라 데이터의 빠른 처리와 분석을 위한 방법의 하나로 R 프로그램 기반의 다양한 병렬처리 패키지가 사용되고 있다. 병렬처리는 수행하려는 작업이 상호의존적이지 않은 작업들로 분해될 수 있을 때 사용하게 되는데, 경우에 따라서는 병렬처리를 위해 분해된 각각의 작업들이 또 다시 상호의존적이지 않은 세부작업으로 분해되기도 한다. 이러한 중첩병렬화 상황에서는 일반적으로 처음 단계에서 분해된 작업들에 대해 병렬처리를 할지, 두 번째 단계에서 세분화되는 작업들에 대해 병렬처리를 할지 선택하게 된다. 그러한 선택이 계산 속도에 상당한 영향을 주는 경우가 많기 때문에 수행하고자 하는 작업의 상황에 따라 병렬처리를 실시할 곳을 잘 결정하는 것이 중요하다. 본 논문에서는 이러한 병렬화 포인트 선택이라는 문제에 대한 이해를 돕고 자신의 문제에 효과적으로 병렬컴퓨팅을 적용하려는 사람들에게 필요한 아이디어를 제공하려는 시도의 하나로 비모수적 함수 추정의 평활량 선택이라는 구체적인 통계문제에 대해 효율적인 계산을 위한 병렬화 포인트 선택 과정을 제시하였다.


Various parallel processing R packages are used for fast processing and the analysis of big data. Parallel processing is used when the work can be decomposed into tasks that are non-interdependent. In some cases, each task decomposed for parallel processing can also be decomposed into non-interdependent subtasks. We have to choose whether to parallelize the decomposed tasks in the first step or to parallelize the subtasks in the second step when facing nested parallelism situations. This choice has a significant impact on the speed of computation; consequently, it is important to understand the nature of the work and decide where to do the parallel processing. In this paper, we provide an idea of how to apply parallel computing effectively to problems by illustrating how to select a parallelism point for the bandwidth selection of nonparametric regression.

KCI등재

7편향 보정 비형태추정량에 관한 연구

저자 : 오정택 ( Jung-taek Oh ) , 신기일 ( Key-il Shin )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 397-408 (12 pages)

다운로드

(기관인증 필요)

초록보기

표본조사에서는 정확한 모수 추정을 위한 다양한 방법이 개발되었으며 이 중에서 보조정보를 이용한 비추정량 또는 회귀추정량이 흔히 사용된다. 최근 많은 연구가 진행되고 있는 비형태추정량(ratio type estimator)은 비추정량의 단점을 보완하여 추정의 정확성을 향상시키는 것으로 알려져 있다. 그러나 비형태추정량은 편향이 있는 것으로 알려져 있어 이를 해결하기 위한 연구가 활발히 진행되고 있다. 이에 본 연구에서는 편향을 제거하기 위해 비형태추정량에 새로운 모수를 추가한 일반화 비형태추정량(generalized ratio-type estimator)을 제안하였다. 또한 사업체조사와 같이 등분산성을 만족하지 않는 자료에서 추정의 정확성 향상을 위해 모형의 오차에 포함된 분산 모수를 추정하고 제안된 추정량을 적용하는 방법을 제안하였다. 또한 모의실험을 통해 일반화 비형태추정량은 기존의 비추정량에 비해 매우 우수한 결과를 주는 것을 확인하였다.


Various methods for accurate parameter estimation have been developed in a sample survey and it is also common to use a ratio estimator or the regression estimator using auxiliary information. The ratio-type estimator has been used in many recent studies and is known to improve the accuracy of estimation by adjusting the ratio estimator. However, various studies are under way to solve it since the ratio-type estimator is biased. In this study, we propose a generalized ratio-type estimator with a new parameter added to the ratio-type estimator to remove the bias. We suggested a method to apply this result to the parameter estimation under the error assumption of heteroscedasticity. Through simulation, we confirmed that the suggested generalized ratio-type estimator gives good results compared to conventional ratio-type estimators.

KCI등재

8주식 수익률에 미치는 투자자들의 관심효과를 검정하기 위한 순서제약추론

저자 : 김영래 ( Youngrae Kim ) , 임요한 ( Johan Lim ) , 이성임 ( Sungim Lee ) , 최수정 ( Sujung Cho

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 409-416 (8 pages)

다운로드

(기관인증 필요)

초록보기

재무 분야에서는 주식 시장에서 투자자들의 행동형태에 대해 많은 연구가 있었다. 본 연구에서는 주식 투자자들의 주식에 대한 관심 정도가 주식의 수익률에 영향을 미치는 효과를 나타내는 관심효과(attention effect)를 실제 자료 분석을 통해 검증하고자 한다. 이러한 효과를 실증적인 자료분석으로부터 검증하기는 쉽지 않았는데, 그 이유는 관심정도를 객관화하여 측정하는 것이 어려운 문제였기 때문이다. 그런데, Da 등 (2011)는 구글 검색창에서의 검색빈도로 관심정도를 측정하고, 이를 바탕으로 미국 주식시장에서의 관심효과를 검증하였다. 본 논문에서는 다음커뮤니케이션이 운영하는 주식 채틱방에서 주식종목에 대한 언급횟수에 대한 순위를 통해 관심정도를 측정하고, 언급횟수에 대한 순위가 높을수록 주식의 수익률이 높아졌다고 할 수 있는지 한국 주식시장에서의 관심효과를 검증하고자 하였다. 이를 위해, 관심효과를 순서제약이 있는 가설로 표현하고, 이에 대한 가능도비 검정절차를 제안하였으며 실제 데이터에 적용해 보았다.


Significant research has been conducted in the financial sector on the behavior of investors in the stock market. In this paper, we directly measure the degree of interest using the ranking of the frequency mentioned in the stock message board operated by Daum Communications Corp. and test the fact that the higher ranking of the frequency results in the higher stock returns in order to investigate the attention effect on the stock returns in the Korean stock market. We also propose and apply the likelihood ratio test procedure for order restricted hypotheses in order to test the attention effect. The test results shows that the higher rank in the frequency mentioned in the message board is related to stock returns (p-value < 10-6). Therefore, we conclude that an investors' attention effects exist in the Korean stock market.

KCI등재

9세포독성 자료를 이용한 분류 알고리즘 성능 비교

저자 : 윤여창 ( Yeochang Yoon ) , 정의배 ( Eui Bae Jeung ) , 조나래 ( Na Rae Jo ) , 주수인 ( Su In

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 3호 발행 연도 : 2018 페이지 : pp. 417-426 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근 동물실험의 대체방법 중 하나로 쥐의 줄기세포 유래 배상체를 이용하여 독성을 시험하는 방법이 개발되었다. 이는 동물에 직접 약물을 주입하는 것이 아닌 배상체 세포에 약물을 투입하여 세포의 변화에 따른 측정값들을 얻는 방법이다. 본 연구에서는 다범주 세포독성 자료를 이용해 통계적 기법인 판별분석(discriminant analysis)과 머신러닝 기법인 서포트 벡터 머신(support vector machine), 인공신경망(artificial neural network), k-인접이웃분류(k-nearest neighbor)의 성능을 비교하였다. 알고리즘의 성능은 분류 정확도(accuracy)와 가중카파계수(weighted Cohen's kappa coefficient)로 비교하였다.


An alternative developmental toxicity test using mouse embryonic stem cell derived embryoid bodies has been developed. This alternative method is not to administer chemicals to animals, but to treat chemicals with cells. This study suggests the use of Discriminant Analysis, Support Vector Machine, Artificial Neural Network and k-Nearest Neighbor. Algorithm performance was compared with accuracy and a weighted Cohen's kappa coefficient. In application, various classification techniques were applied to cytotoxicity data to classify drug toxicity and compare the results.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

이화여자대학교 덕성여자대학교 서울대학교 성균관대학교 연세대학교
 65
 58
 48
 46
 44
  • 1 이화여자대학교 (65건)
  • 2 덕성여자대학교 (58건)
  • 3 서울대학교 (48건)
  • 4 성균관대학교 (46건)
  • 5 연세대학교 (44건)
  • 6 고려대학교 (34건)
  • 7 한국수자원공사 (30건)
  • 8 중앙대학교(서울) (25건)
  • 9 충남대학교 (23건)
  • 10 경희대학교 (22건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기