Categorieën
...

Multivariate variantieanalyse

Variantieanalyse is een set statistische methoden die zijn ontworpen om hypothesen te testen over de relatie tussen bepaalde tekens en de onderzochte factoren, die geen kwantitatieve beschrijving hebben, en om de mate van invloed van factoren en hun interactie vast te stellen. In de gespecialiseerde literatuur wordt het vaak ANOVA genoemd (van de Engelse naam Analysis of Variations). Deze methode werd voor het eerst ontwikkeld door R. Fisher in 1925.

Typen en criteria voor variantieanalyse

Deze methode wordt gebruikt om de relatie tussen kwalitatieve (nominale) attributen en een kwantitatieve (continue) variabele te bestuderen. In feite test hij de hypothese dat het rekenkundig gemiddelde van verschillende steekproeven gelijk is. Het kan dus worden beschouwd als een parametrisch criterium voor het vergelijken van de centra van meerdere monsters tegelijk. Als u deze methode voor twee monsters gebruikt, zijn de resultaten van de variantieanalyse identiek aan de resultaten van de t-student-test. In tegenstelling tot andere criteria stelt dit onderzoek ons ​​echter in staat het probleem nader te bestuderen.

Variantieanalyse

Variantieanalyse in statistieken is gebaseerd op de wet: de som van de kwadraten van de afwijkingen van de gecombineerde steekproef is gelijk aan de som van de kwadraten van de intragroepsafwijkingen en de som van de kwadraten van de intergroepsafwijkingen. Voor het onderzoek wordt de Fisher-test gebruikt om het belang van het verschil tussen intergroepsvarianties en intragroepsvarianties vast te stellen. Hiervoor zijn echter de noodzakelijke voorwaarden de normale verdeling en homoskedasticiteit (gelijkheid van varianties) van de monsters. Maak onderscheid tussen eendimensionale (univariate) variantieanalyse en multivariate (multivariate). De eerste beschouwt de afhankelijkheid van de bestudeerde hoeveelheid van één attribuut, de tweede - onmiddellijk van vele, en stelt u ook in staat om de relatie tussen hen te identificeren.

factoren

Factoren worden gecontroleerde omstandigheden genoemd die het eindresultaat beïnvloeden. Het niveau of de verwerkingsmethode wordt de waarde genoemd die de specifieke manifestatie van deze aandoening kenmerkt. Deze nummers worden meestal gegeven op een nominale of seriële schaal. Vaak worden outputwaarden gemeten in kwantitatieve of ordinale schalen. Dan ontstaat het probleem van het groeperen van de uitvoergegevens in een reeks waarnemingen, die overeenkomen met ongeveer dezelfde numerieke waarden. Als het aantal groepen als te groot wordt beschouwd, kan het aantal waarnemingen daarin onvoldoende zijn om betrouwbare resultaten te verkrijgen. Als u het aantal te klein neemt, kan dit leiden tot verlies van belangrijke kenmerken van de impact op het systeem. De specifieke manier waarop gegevens worden gegroepeerd, is afhankelijk van het volume en de aard van de variatie in de waarden. Het aantal en de grootte van intervallen in eenrichtingsanalyse wordt meestal bepaald door het principe van gelijke intervallen of door het principe van gelijke frequenties.

Analyse van variantieproblemen

Er zijn dus gevallen waarin u twee of meer monsters moet vergelijken. Het is dan dat het gebruik van variantieanalyse aan te raden is. De naam van de methode geeft aan dat conclusies worden getrokken uit de studie van de componenten van de variantie. De essentie van het onderzoek is dat de algemene verandering in de indicator is verdeeld in samenstellende delen die overeenkomen met de actie van elke individuele factor. Overweeg een aantal problemen dat een typische variantieanalyse oplost.

Voorbeeld 1

De werkplaats heeft een aantal werktuigmachines - automatische machines die een specifiek onderdeel produceren. De grootte van elk onderdeel is een willekeurige waarde, die afhankelijk is van de instellingen van elke machine en willekeurige afwijkingen die optreden tijdens de productie van onderdelen.Het is noodzakelijk om te bepalen of de machines gelijk zijn geconfigureerd volgens de afmetingen van de onderdelen van de onderdelen.

analyse van variantie methoden

Voorbeeld 2

Tijdens de vervaardiging van het elektrische apparaat worden verschillende soorten isolatiepapier gebruikt: condensor, elektrisch, enz. Het apparaat kan worden geïmpregneerd met verschillende stoffen: epoxyhars, vernis, ML-2-hars, enz. Lekken kunnen onder vacuüm bij hoge druk worden verholpen door verhitting. Het kan worden geïmpregneerd door onderdompeling in vernis, onder een continue stroom vernis, enz. Het elektrische apparaat als geheel wordt gegoten met een bepaalde verbinding, waarvan er verschillende opties zijn. Kwaliteitsindicatoren zijn de diëlektrische sterkte van de isolatie, de temperatuur van de oververhitting van de wikkeling in bedrijfsmodus en een aantal andere. Tijdens het testen van het technologische proces van het vervaardigen van apparaten, is het noodzakelijk om te bepalen hoe elk van de genoemde factoren de prestaties van het apparaat beïnvloedt.

Voorbeeld 3

Het trolleybusdepot bedient verschillende trolleybusroutes. Verschillende soorten trolleybussen werken voor hen, en het verzamelen van tarieven wordt verzameld door 125 controllers. Het depotbeheer is geïnteresseerd in de vraag: hoe de economische prestaties van elke controller (omzet) te vergelijken, rekening houdend met verschillende routes, verschillende soorten trolleybussen? Hoe de economische haalbaarheid bepalen van het vrijgeven van een bepaald type trolleybus op een bepaalde route? Hoe redelijke eisen te stellen aan de hoeveelheid inkomsten die de dirigent op elke route in verschillende soorten trolleybussen brengt?

De taak van het kiezen van een methode is om de maximale informatie te verkrijgen over de impact op het eindresultaat van elke factor, om de numerieke kenmerken van een dergelijk effect, hun betrouwbaarheid tegen de laagste kosten en in de kortst mogelijke tijd te bepalen. Los dergelijke problemen op en laat variantieanalyses toe.

Eenrichtingsanalyse

Het onderzoek heeft als doel de omvang van de impact van een bepaald geval op de geanalyseerde beoordeling te beoordelen. Een andere taak van eenrichtingsanalyse kan zijn om twee of meer omstandigheden met elkaar te vergelijken om het verschil in hun effect op de terugroepactie te bepalen. Als de nulhypothese wordt verworpen, is de volgende stap de kwantitatieve beoordeling en constructie van betrouwbaarheidsintervallen voor de verkregen kenmerken. In het geval wanneer nulhypothese kan niet worden weggegooid, het wordt meestal geaccepteerd en er wordt een conclusie getrokken over de essentie van invloed.

Univariate variantieanalyse kan een niet-parametrische analoog van de rangmethode Kraskel-Wallis worden. Het werd ontwikkeld door de Amerikaanse wiskundige William Kraskel en econoom Wilson Wallis in 1952. Dit criterium werd toegekend om de nulhypothese te testen dat de effecten op de onderzochte monsters gelijk zijn aan onbekende maar gelijke gemiddelde waarden. Het aantal monsters moet meer dan twee zijn.

analyse van variantie statistieken

Het Jonkhier-criterium (Jonkhier-Terpstra) werd onafhankelijk voorgesteld door de Nederlandse wiskundige T.J. Terpstrom in 1952 en de Britse psycholoog E.R. Jonkhier in 1954. Het wordt gebruikt wanneer van tevoren bekend is dat de beschikbare groepen resultaten zijn geordend op de groei van de invloed van de bestudeerde factor, die wordt gemeten op een ordinale schaal.

M - de Bartlett-test, voorgesteld door de Britse statisticus Maurice Stevenson Bartlett in 1937, wordt gebruikt om de nulhypothese te testen over de gelijkheid van varianties van verschillende normale algemene populaties waaruit de bestudeerde monsters zijn genomen, met in het algemeen verschillende volumes (het aantal van elk monster moet ten minste vier zijn ).

G is de Cochren-test, die werd ontdekt door de Amerikaan William Gemmel Cochren in 1941. Het wordt gebruikt om de nulhypothese te testen dat de varianties van normale algemene populaties gelijk zijn voor onafhankelijke monsters met hetzelfde volume.

Het niet-parametrische Levene-criterium, voorgesteld door de Amerikaanse wiskundige Howard Levene in 1960, is een alternatief voor het Bartlett-criterium in omstandigheden waarbij er geen zekerheid is dat de onderzochte monsters de normale verdeling volgen.

In 1974 stelden de Amerikaanse statistici Morton B. Brown en Alan B. Forsyth een test voor (Brown-Forsythe-criterium), die enigszins afwijkt van het Leuven-criterium.

Twee-factor analyse

Tweeweg variantieanalyse wordt gebruikt voor gekoppelde normaal verdeelde monsters. In de praktijk worden vaak complexe tabellen van deze methode gebruikt, met name die waarin elke cel een set gegevens (herhaalde metingen) bevat die overeenkomen met vaste niveauwaarden. Als niet wordt voldaan aan de veronderstellingen die nodig zijn voor het toepassen van een tweewegs variantieanalyse, wordt het niet-parametrische Friedman-rangcriterium (Friedman, Kendall en Smith) dat eind 1930 door de Amerikaanse econoom Milton Friedman is ontwikkeld, gebruikt Dit criterium is onafhankelijk van het type distributie.

Er wordt alleen aangenomen dat de verdeling van hoeveelheden hetzelfde en continu is, en ze zijn onafhankelijk van elkaar. Bij het testen van de nulhypothese wordt de uitvoer gepresenteerd in de vorm van een rechthoekige matrix waarin de rijen overeenkomen met de niveaus van factor B en de kolommen overeenkomen met niveaus van A. Elke cel van de tabel (blok) kan het resultaat zijn van metingen van parameters op één object of op een groep objecten met constante waarden van de niveaus van beide factoren . In dit geval worden de overeenkomstige gegevens geleverd als de gemiddelde waarden van een bepaalde parameter voor alle metingen of objecten van het onderzochte monster. Om het criterium van de uitvoergegevens toe te passen, moet u overschakelen van de directe meetresultaten naar hun rang. De rangorde wordt voor elke rij afzonderlijk uitgevoerd, dat wil zeggen dat de waarden voor elke vaste waarde worden geordend.

variantieanalyse in statistieken

Pagina-criterium (L-criterium), voorgesteld door de Amerikaanse statisticus E. B. Page in 1963, is bedoeld om de nulhypothese te testen. Voor grote monsters wordt de pagina-benadering gebruikt. Afhankelijk van de realiteit van de overeenkomstige nulhypothesen houden ze zich aan de standaard normale verdeling. In het geval dat de rijen van de brontabel dezelfde waarden hebben, moeten gemiddelde rangen worden gebruikt. Bovendien zal de nauwkeurigheid van de conclusies slechter zijn, hoe meer er dergelijke toevalligheden zullen zijn.

Q is het Cochren-criterium voorgesteld door V. Cohren in 1937. Het wordt gebruikt in gevallen waarin groepen homogene personen worden blootgesteld aan meer dan twee en waarvoor twee responsen mogelijk zijn - voorwaardelijk negatief (0) en voorwaardelijk positief (1) . De nulhypothese bestaat uit gelijke invloedseffecten. Met variantieanalyse in twee richtingen kan het bestaan ​​van verwerkingseffecten worden bepaald, maar kan niet worden vastgesteld voor welke kolommen dit effect bestaat. Om dit probleem op te lossen, wordt de methode van meerdere Sheffe-vergelijkingen voor gekoppelde monsters gebruikt.

Multivariate analyse

De taak van multivariate variantieanalyse ontstaat wanneer het noodzakelijk is om de invloed van twee of meer voorwaarden op een bepaalde willekeurige variabele te bepalen. De studie voorziet in de aanwezigheid van één afhankelijke willekeurige variabele, gemeten op de schaal van verschil of relaties, en verschillende onafhankelijke variabelen, die elk worden uitgedrukt in de schaal van namen of in rang. Analyse van variantie-gegevens is een redelijk ontwikkelde sectie van wiskundige statistieken, die veel opties heeft. Het onderzoeksconcept is gebruikelijk voor zowel single-factor als multi-factor. De essentie is dat de totale variantie is verdeeld in componenten, wat overeenkomt met een bepaalde gegevensgroep. Elke gegevensgroep heeft zijn eigen model.Hier zullen we alleen de basisbepalingen beschouwen die nodig zijn voor het begrijpen en praktisch gebruik van de meest gebruikte opties.

variantieanalyse in één richting

Analyse van variantie van factoren vereist een tamelijk zorgvuldige houding ten opzichte van het verzamelen en presenteren van inputgegevens, en met name ten aanzien van de interpretatie van de resultaten. In tegenstelling tot één-factor, waarvan de resultaten willekeurig in een bepaalde volgorde kunnen worden geplaatst, vereisen de twee-factor-resultaten een meer complexe weergave. Een nog moeilijkere situatie doet zich voor wanneer er drie, vier of meer omstandigheden zijn. Hierdoor worden zelden meer dan drie (vier) voorwaarden in een model opgenomen. Een voorbeeld is het optreden van resonantie bij een bepaalde waarde van de capaciteit en inductie van de elektrische cirkel; de manifestatie van een chemische reactie met een bepaalde set elementen waaruit het systeem is opgebouwd; het optreden van abnormale effecten in complexe systemen met een bepaalde samenloop van omstandigheden. De aanwezigheid van interactie kan het model van het systeem fundamenteel veranderen en soms leiden tot een heroverweging van de aard van de fenomenen waarmee de experimentator te maken heeft.

Multivariate variantieanalyse met herhaalde experimenten

Meetgegevens kunnen vaak niet door twee worden gegroepeerd, maar door een groter aantal factoren. Dus als we de variantieanalyse van de levensduur van de banden van de trolleybuswielen beschouwen, rekening houdend met de omstandigheden (de fabrikant en de route waarop de banden worden gebruikt), kunnen we het seizoen waarin de banden worden gebruikt (namelijk winter- en zomerbedrijf) als een afzonderlijke voorwaarde onderscheiden. Als gevolg hiervan hebben we de taak van een drie-factor-methode.

Als er meer voorwaarden zijn, is de aanpak dezelfde als in de tweefactorenanalyse. In alle gevallen proberen ze het model te vereenvoudigen. Het fenomeen van de interactie van twee factoren komt niet zo vaak tot uiting en drievoudige interactie komt alleen in uitzonderlijke gevallen voor. Ze omvatten de interactie waarvoor er eerdere informatie is en goede redenen om hier in het model rekening mee te houden. Het proces van het isoleren en in aanmerking nemen van individuele factoren is relatief eenvoudig. Daarom is er vaak de wens om meer omstandigheden te benadrukken. Dit mag niet worden weggevoerd. Hoe meer omstandigheden, hoe minder betrouwbaar het model wordt en hoe groter de kans op fouten. Het model zelf, dat een groot aantal onafhankelijke variabelen bevat, wordt moeilijk genoeg te interpreteren en onhandig voor praktisch gebruik.

Het algemene idee van variantieanalyse

Variantieanalyse in statistieken is een methode om de resultaten te verkrijgen van observaties die afhankelijk zijn van verschillende tegelijkertijd bestaande omstandigheden, en om hun impact te beoordelen. Een gecontroleerde variabele die overeenkomt met de methode om het studieobject te beïnvloeden en in een bepaalde periode een bepaalde waarde verwerft, wordt een factor genoemd. Ze kunnen kwalitatief en kwantitatief zijn. Niveaus van kwantitatieve voorwaarden krijgen een bepaalde waarde op een numerieke schaal. Voorbeelden zijn temperatuur, druk, hoeveelheid stof. Kwalitatieve factoren zijn verschillende stoffen, verschillende technologische methoden, apparaten, vulstoffen. Hun niveaus komen overeen met de schaal van namen.

variantieanalyse

De kwaliteit kan ook het type verpakkingsmateriaal, opslagomstandigheden van de doseringsvorm omvatten. Het is ook rationeel om de mate van malen van grondstoffen toe te schrijven, de fractionele samenstelling van korrels die van kwantitatief belang zijn, maar moeilijk te controleren zijn als een kwantitatieve schaal wordt gebruikt. Het aantal kwaliteitsfactoren hangt af van het type doseringsvorm, evenals de fysische en technologische eigenschappen van de medicinale stoffen. Tabletten kunnen bijvoorbeeld worden verkregen uit kristallijne stoffen door directe compressie. In dit geval is het voldoende om een ​​keuze te maken uit glij- en smeermiddelen.

Voorbeelden van kwalitatieve factoren voor verschillende soorten doseringsvormen

  • Tincturen. De samenstelling van het extractiemiddel, het type extractor, de bereidingswijze van grondstoffen, de productiemethode, de filtermethode.
  • Extracten (vloeibaar, dik, droog). De samenstelling van het extractiemiddel, de extractiemethode, het type installatie, de methode voor het verwijderen van het extractiemiddel en ballaststoffen.
  • Tabletten. De samenstelling van hulpstoffen, vulstoffen, desintegreermiddelen, bindmiddelen, smeermiddelen en glijmiddelen. Een methode voor het produceren van tabletten, type verwerkingsapparatuur. Type schaal en zijn componenten, filmvormers, pigmenten, kleurstoffen, weekmakers, oplosmiddelen.
  • Injectie oplossingen. Type oplosmiddel, filtratiemethode, aard van stabilisatoren en conserveermiddelen, sterilisatieomstandigheden, methode voor het vullen van ampullen.
  • Zetpillen. De samenstelling van de zetpilbasis, een methode voor het produceren van zetpillen, vulstoffen, verpakkingen.
  • Zalf. De samenstelling van de basis, structurele componenten, de bereidingswijze van de zalf, het type apparatuur, de verpakking.
  • Capsules. Type schaalmateriaal, methode voor het produceren van capsules, type weekmaker, conserveermiddel, kleurstof.
  • Smeersels. De bereidingsmethode, samenstelling, type apparatuur, type emulgator.
  • Suspension. Type oplosmiddel, type stabilisator, dispersiemethode.

Voorbeelden van kwalitatieve factoren en hun niveaus bestudeerd in het productieproces van tablets

  • Bakpoeder. Aardappelzetmeel, witte klei, een mengsel van natriumbicarbonaat met citroenzuur, basisch magnesiumcarbonaat.
  • Bindende oplossing. Water, zetmeelpasta, suikersiroop, methylcellulose-oplossing, hydroxypropylmethylcellulose-oplossing, polyvinylpyrrolidon-oplossing, polyvinylalcoholoplossing.
  • Glijmiddel. Spuitbus, zetmeel, talk.
  • Filler. Suiker, glucose, lactose, natriumchloride, calciumfosfaat.
  • Smeermiddel. Stearinezuur, polyethyleenglycol, paraffine.

Analyse van variantie modellen in de studie van het concurrentievermogen van de staat

Een van de belangrijkste criteria voor de beoordeling van de toestand van de staat, die het niveau van welzijn en sociaal-economische ontwikkeling beoordeelt, is concurrentievermogen, dat wil zeggen een reeks eigenschappen die inherent zijn aan de nationale economie, die het vermogen van de staat bepalen om met andere landen te concurreren. Nadat we de plaats en de rol van de staat op de wereldmarkt hebben bepaald, kunnen we een duidelijke strategie vaststellen economische zekerheid internationaal, omdat het de sleutel is tot positieve relaties tussen Rusland en alle spelers op de wereldmarkt: investeerders, crediteuren, staatsoverheden.

Om het concurrentievermogen van landen te vergelijken, worden landen gerangschikt op basis van complexe indices met verschillende gewogen indicatoren. De basis van deze indices zijn de belangrijkste factoren die de economische, politieke, enz. Situatie beïnvloeden. Een reeks modellen voor het bestuderen van het concurrentievermogen van de staat voorziet in het gebruik van multivariate statistische analysemethoden (met name variantieanalyse (statistieken), econometrische modellering, besluitvorming) en omvat de volgende hoofdstappen:

  1. Vorming van een systeem van indicatoren-indicatoren.
  2. Beoordeling en voorspelling van indicatoren voor het concurrentievermogen van de staat.
  3. Vergelijking van indicatoren-indicatoren van het concurrentievermogen van staten.

Beschouw nu de inhoud van de modellen van elk van de fasen van dit complex.

In de eerste fase Met behulp van deskundige studiemethoden wordt een gerechtvaardigde reeks economische indicatoren-indicatoren voor het beoordelen van het concurrentievermogen van de staat gevormd, rekening houdend met de specifieke kenmerken van zijn ontwikkeling op basis van internationale beoordelingen en gegevens van statistische afdelingen die de toestand van het systeem als geheel en zijn processen weerspiegelen.De keuze voor deze indicatoren wordt gerechtvaardigd door de noodzaak om de indicatoren te selecteren die vanuit het oogpunt van de praktijk het best in staat zijn om het niveau van de staat, zijn investeringsaantrekkelijkheid en de mogelijkheden van relatieve lokalisatie van bestaande potentiële en reële bedreigingen te bepalen.

data-analyse van variantie

De belangrijkste indicatoren-indicatoren van internationale ratingsystemen zijn de indices:

  1. Wereldwijd concurrentievermogen (IGC).
  2. Economische vrijheid (IES).
  3. Human Development (HDI).
  4. Perceptions of Corruption (CPI).
  5. Interne en externe bedreigingen.
  6. Het potentieel van internationale invloed (IPMV).

Tweede fase Het voorziet in de beoordeling en voorspelling van indicatoren van het concurrentievermogen van de staat volgens internationale ratings voor de onderzochte 139 landen van de wereld.

Derde fase biedt een vergelijking van de concurrentievoorwaarden van staten die methoden gebruiken correlatie- en regressieanalyse.

Met behulp van de resultaten van het onderzoek is het mogelijk om de aard van de processen als geheel en door afzonderlijke componenten van het concurrentievermogen van de staat te bepalen; test de hypothese van de invloed van factoren en hun relatie met de juiste significantieniveau.

De implementatie van de voorgestelde reeks modellen zal niet alleen toelaten om de huidige situatie van het concurrentievermogen en de investeringsaantrekkelijkheid van staten te beoordelen, maar ook om de zwakke punten van het management te analyseren, fouten van onjuiste beslissingen te voorkomen en de ontwikkeling van een crisis in de staat te voorkomen.


1 opmerking
show:
nieuw
nieuw
populair
besproken
×
×
Weet je zeker dat je de reactie wilt verwijderen?
Verwijder
×
Reden voor klacht
avatar
SPSS
Belangrijke problemen die zich voordoen bij het interpreteren van de resultaten van variantieanalyse zijn interacties, het relatieve belang van factoren en meerdere vergelijkingen.
antwoord
0

bedrijf

Succesverhalen

uitrusting