Na de segmentatie van ondernemingen wordt het scoremodel ontwikkeld aan de hand van de volgende 5 punten.
1. De karakteranalyse
Bij de karakteranalyse analyseren we het gedrag van verschillende bedrijven in het verleden die tot een faillissement hebben geleid. Hierbij worden alle variabelen nauwkeurig geklasseerd, zodat alle scorebanden ten minste 30 standaarden bevatten.
Hiernaast worden alle variabelen ook grof geklasseerd, om robuuste getallen te garanderen en foutieve trends af te vlakken. Variabelen die niet op een statistisch verantwoorde manier bijdragen aan de accuraatheid van het model, worden verwijderd.
Alle beschikbare bedrijfskenmerken komen in aanmerking voor de modellering. Door fijne classificatie is elke variabele initieel opgesplitst in groepen van minimaal 30 gefaalde ondernemingen.
De grove intervalindeling wordt gebruikt om de fijn geklasseerde intervallen te groeperen. Zo zorgen we ervoor dat binnen elk te modelleren interval voldoende waarnemingen worden gebruikt en dat eventuele foutieve trends in het risicoprofiel of uitschieters van de variabele worden afgevlakt.
Variabelen zijn in eerste instantie grof geclassificeerd op basis van de informatiewaarde. Alle variabelen met een informatiewaarde voor de fijne klasse van minder dan 0,05 worden uitgesloten. Ze worden ook uitgesloten als ze een trend vertonen die zakelijk gezien niet logisch is of als de algemene trend niet monotoon is.
2. Het logaritmische regressiemodel
GraydonCreditsafe gebruikt als voorkeursmethode om het scoremodel te ontwikkelen stapsgewijze logaritmische regressie. Dit heeft het voordeel dat het een voorspelde waarschijnlijkheid van goed oplevert; waardoor het mogelijk wordt om een nauwkeurige score-naar-slecht-voorspelling te maken.
Bij het opstellen van het logaritmische regressiemodel maken we gebruik van de zogenaamde Chi-kwadraattoets en Gini-index. Dit zijn twee termen uit de statistiek.
De Chi-kwadraat is in de statistiek een toets om na te gaan of twee of meer verdelingen (populaties) van elkaar verschillen. De Gini-index is een statistische maatstaf van de ongelijkheid in een verdeling. De Gini-index wordt veel gebruikt in de economie om de ongelijkheid in inkomen of vermogen aan te geven, maar is geschikt om elke vorm van ongelijkmatige verspreiding te meten.
We gebruiken de Gini-index om variabelen te identificeren die niet bijdragen aan het significantieniveau en te verwijderen. Daarover hieronder meer.
3. Het waarschijnlijkheidsniveau
De variabele met de hoogste significante Chi-kwadraatwaarde wordt toegevoegd aan het model. Nadat elke variabele is toegevoegd, wordt elke variabele met een niet-significante Chi-kwadraatwaarde verwijderd. Dit proces gaat een voor een door totdat er geen nieuwe variabelen meer zijn die het bestaande model significant verbeteren.
De waarschijnlijkheid > Chi-kwadraatwaarde meet de waarschijnlijkheid dat de schatting van de variabele parameter op toeval berust en niet actief waarde toevoegt aan het model. Hoe lager de waarde, hoe meer betekenis deze heeft in een voorspellend model.
4. Het significantieniveau
Het significantieniveau is het punt waarop een variabele significant genoeg wordt geacht om in het model te worden opgenomen. Het houdt rechtstreeks verband met de waarschijnlijkheid > Chi-kwadraat-waarde.
Het significantieniveau waarop de variabelen in het model worden opgenomen, is vastgesteld op 5%. Dat houdt in dat een variabele met een Significantie > Chi-kwadraatwaarde > 0,05 niet in het model wordt opgenomen. Dit betekent in feite dat alle variabelen die minder dan 0.05% bijdragen aan de uiteindelijke score, worden verwijderd.
Daarnaast wordt extra gecontroleerd dat alle toegekende punten in overeenstemming zijn met de bijbehorende "goede" / "slechte" kansen. Hiernaast worden alle variabelen die tegen hun trend scoren of resulteren in een vermindering van de Gini-index, verwijderd.
5. Uitlijningsfouten corrigeren en controleren op logica
GraydonCreditsafe gebruikt uitlijningsfoutenrapporten voor variabelen in het model om ervoor te zorgen dat deze correct zijn uitgelijnd.
Zoals we bij de karakteranalyse hebben uitgelegd, moet zelfs als een variabele voorspellend vermogen heeft, nog worden gecontroleerd of het verband met de uitkomst daadwerkelijk logisch is en aan de verwachtingen voldoet.
De eerste controle van de logica zal daarom worden uitgevoerd tijdens de univariate analyse: een analyse van de uitkomsten van een enkele kansvariabele. Hierbij worden de variabelen die vanuit bedrijfsperspectief niet geschikt zijn verwijderd.
Ook moet een extra algemene controle worden uitgevoerd van het model dat uit de regressie is voortgekomen. Als de analyse juist is uitgevoerd, moet het model voorspellend zijn en wiskundig correct. Daarnaast moet de geldigheid vanuit bedrijfseconomisch oogpunt ook worden gecontroleerd.
Het is belangrijk om te controleren of de voorlopige schattingen die we aan de kenmerkende eigenschappen gegeven hebben, consistent zijn met de ratio voor ‘slecht’. Dit moet gelden voor alle voor een bepaald kenmerk gedefinieerde eigenschappen. Daarbij schenken we extra aandacht aan de bètaschattingen.