
Moderators: dirkwb, Xilvo

Berichten: 20



Voor statistiek de volgende opgave. Het heeft betrekking tot de chi-kwadraat toets. Bij opgave B moet je die gaan berekenen. Deze heb ik berekend via het programma [R]:


De vraag:

In quantitative studies of literary style sometimes stochastic models for word counts are used. When Jane Austen died, her novel Sanditon was only partly finished, but Austen had already made a summary of the remaining part of the novel. A literary talented admirer of Austen finished the novel, while he tried as much as possible to imitate Austen’s style. The file austen contains counts of different words used by Jane Austen and her admirer: chapters 1 and 3 of Sense and Sensibility, chapters 1,2,3 of Emma, chapter 1 and 6 of Sanditon written by Austen, and chapters 12 and 24 of

Sanditon written by the admirer.

a. Do the data in this case come from 1 sample or from more than 1 sample?

b. Investigate with a suitable chi-square test whether or not Austen was consistent in these aspects of style from one work to another. Formulate the hypotheses of the test in such way that they correspond to your answer in part a.

c. Did Austen’s admirer successfully copy this aspect of her style? Why (not)?

Bij A denk ik dat het van dezelfde populatie is (namelijk originele auteur en 'fan' auteur) en dat de data die gegeven is onderdeel is van één geheel. Heb ik dit juist? Graag uw visie hierop.

Zoals u kunt zien in het plaatje heb ik de chi-kwadraat al berekend. Bij b moet ik mijn hypothese dusdanig opstellen dat het overeenkomt met A. Als ik een juiste antwoord bij A heb, dan is de rest geen probleem, ook onderdeel C niet.

Dank u.

Berichten: 10.179

Re: Sample

Verplaatst naar Statistiek.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 132

Re: Sample

En waarom niet dit:

De data is van 2 verschillende populaties, namelijk de 'populatie ' (kromme benaming) schrijfster en de populatie na-aper. De Chi-kwadraat test wordt vervolgens gedaan om te kijken of er een significant verschil is tussen beide populaties, indien er geen significant verschil wordt gevonden kun je concluderen dat de populaties erg veel op elkaar lijken en dat de fan dus een goede imitatie heeft neergezet.

Puur een idee dat ik heb op basis van de gegevens die je ons geeft. Waarom ga je ervan uit dat het anders dezelfde populatie is, welke indicatie wordt hiervoor gegeven?
